LLMs训练经验帖来自:AiGC面试宝典宁静致远2023年09月28日22:03分布式训练框架选择?多用DeepSpeed,少用Pytorch原生的torchrun。在节点数...
大模型(LLMs)微调面来自:AiGC面试宝典宁静致远2023年12月24日00:44大模型(LLMs)微调面1.如果想要在某个模型基础上做全参数微调,究竟...
大模型(LLMs)进阶面来自:AiGC面试宝典宁静致远2023年09月28日21:54一、什么是生成式大模型?生成式大模型(一般简称大模型LLMs)是指能...
相似度函数篇来自:AiGC面试宝典宁静致远2024年01月12日06:35一、除了cosin还有哪些算相似度的方法除了余弦相似度(cosinesimilarity)之外...
LLMs损失函数篇来自:AiGC面试宝典宁静致远2024年01月28日13:20一、介绍一下KL散度?KL(Kullback-Leibler)散度衡量了两个概率分布之间的...
transformers操作篇来自:AiGC面试宝典宁静致远2024年01月28日13:201.如何利用transformers加载Bert模型?可以看到,包括import在内的不到...
Attention升级面来自:AiGC面试宝典宁静致远2023年09月29日13:261传统Attention存在哪些问题?2Attention优化方向3Attention变体有哪些?4M...
LLMs激活函数篇来自:AiGC面试宝典宁静致远2023年09月29日12:411介绍一下FFN块计算公式?2介绍一下GeLU计算公式?3介绍一下Swish计算公式?...
Layernormalization篇来自:AiGC面试宝典宁静致远2023年09月29日12:37Layernormalization-方法篇一、LayerNorm篇1.1LayerNorm的计算公式写...
大模型(LLMs)基础面来自:AiGC面试宝典宁静致远2023年09月28日21:501目前主流的开源模型体系有哪些?目前主流的开源模型体系分三种:2pre...
2023年AI大模型应用研究报告头豹研究院弗若斯特沙利文咨询(中国)AI、AGI、大模型、通用大模型、行业大模型2023年12月————沙利文联合...
体系化人工智能(HolisticAI)技术探索中国移动研究院张世磊2023.11.24日趋泛在的智能化需求和智能化技术赋能成本高之间的矛盾日趋泛在的智能...
2025深度用云展望当前,新一轮科技革命和产业变革正在蓬勃发展,云计算产业在全球市场风起云涌,AI技术加快从理论走进现实,数字化成为每一...
中国信息通信研究院北京人形机器人创新中心有限公司2024年8月具身智能发展报告(2024年)No.202405版权声明本报告版权属于中国信息通信研究院...
-----------------------------------------◆-----------------------------------------大模型在金融行业的落地探索祝世虎CONTENTS目录数...
大模型合规白皮书20232023年11月大模型合规白皮书金杜律师事务所上海人工智能研究院华为技术有限公司上海昇思AI框架&大模型创新中心2023年1...
大模型可信赖研究报告(2023年)上海商汤智能科技有限公司中国信息通信研究院云计算与大数据研究所2023年12月版权声明本报告版权属于上海商...
CGE模型在中国的应用ApplicationofCGEModelsinChina中国能源模型论坛ChinaEnergyModelingForum2023年10月October20231前言上个世纪90年代初...
大模型时代的“APP”,探索新一代人机交互及协作范式2024中国AIAgent行业研究报告注:AIGC生成内容亦对本报告有贡献CONTENTS目录Part01前世...