中泰证券:DeepSeek将如何改变AI应用?VIP专享

中泰证券研究所专业|领先|深度|诚信|证券研究报告|2025.02.13DeepSeek将如何改变AI应用?分析师:闻学臣执业证书编号:S0740519090007分析师:苏仪执业证书编号:S0740520060001分析师:王雪晴执业证书编号:S0740524120003联系人:刘一哲Email:liuyz03@zts.com.cn2核心观点◼从kimi(月之暗面)到智谱,从豆包(字节)到DeepSeek,中国基础大模型一直处于快速演进之中,演进的主旋律则体现为性能提升和成本降低,与计算机历史上PC、互联网的发展逻辑类似。我们总结了以下三个关键词:◼关键词1:低成本。与暴力美学的大模型相对应的就是高成本,动则数百上千万元的成本投入在很大程度上制约了下游需求的释放,在中国当前的宏观环境下这种挑战更为明显。DeepSeek带来的成本指数级下降,将会大大加速AI应用的落地进程。◼关键词2:开源。伴随闭源基础大模型能力不断提升之后,是否会向上侵蚀应用市场成为了市场的一种担忧。而开源体系大大降低这种可能:1)开源体系需要生态繁荣,基模厂商与应用厂商是合作关系;2)对于应用厂商而言,开源大模型的可获得性、可把握性更强,更容易基于此构建自己的垂直模型和能力。◼关键词3:中国。中国具有广阔的应用场景,但一方面接入海外OpenAI模型存在一定的障碍,另一方面中国的基础大模型能力存在差距。DeepSeek缩小了这种能力差距,一定程度上补齐了中国AI应用的底座短板。3CONTENTS目录CCONTENTS专业|领先|深度|诚信中泰证券研究所1BigPicture:从基础模型的能力上限和应用成本谈起4图表:AI应用分析框架资料来源:中泰证券研究所应用的分析框架:能力上限与应用成本共同决定应用场景◼AI随模型能力的提升和应用成本的降低,共同解锁更多应用场景。技术-能力上限曲线价格-应用成本曲线模型能力上限模型定价应用场景随模型能力提升和成本降低而不断解锁;DeepSeek的低成本+强能力将解锁更多应用场景;对话场景;智能客服;……营销医疗法律……AI搜索;AI代码;……5图表:R1在各项任务中的表现资料来源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning,中泰证券研究所图表:DeepSeekV3和其他模型的表现对比资料来源:DeepSeek-V3TechnicalReport,中泰证券研究所能力上限之一:DeepSeek系列模型拥有比肩GPT-4o、Claude3.5和o1的能力◼DeepSeekV3再次展现出能力上限突破,在MMLU、MATH500等任务中均表现除了优于GPT-4o和Claude-3.5-Sonnet的SOTA能力。其发布的推理模型DeepSeek-R1在数学、编程等推理任务中接近或达到了o1的水平。6图表:随步数提升R1-Zero的AIME任务准确度资料来源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning,中泰证券研究所能力上限之二:后训练阶段大规模应用强化学习,表现推理能力扩展◼DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动微调+强化学习方法,R1-Zero版本模型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力涌现等)。图表:深度思考能力提升资料来源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning,中泰证券研究所DeepSeek-R1-Zero的能力随步数提升DeepSeek-R1-Zero自然涌现long-CoT能力7图表:训练过程中R1-Zero表现出的AhaMoment资料来源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning,中泰证券研究所能力上限之二:纯强化学习的R1-Zero展现出“AhaMoment”能力涌现◼RL下模型展现出了自主开发先进问题解决策略的行为:1)模型表现出了“Ahamoment”,突然学会更有效的推理方式,也增加了推理复杂度;2)模型在训练过程中出现了Reflection能力,能够重新评估初始方法来学习为问题分配更多的思考时间。虽然应用纯强化学习方法的R1-Zero在稳定性、可读性上仍有差距(存在多语言混杂生成现象),但AhaMoment、Reflection等能力的出现展现出了纯强化学习方法的巨大潜力。8图表:Janus-Pro多模态理解和视觉生成表现资料来源:Janus-Pro:UnifiedMultimodalUnderstandingandGenerationwith...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

碳中和
已认证
内容提供者

碳中和

确认删除?
回到顶部
微信客服
  • 管理员微信
QQ客服
  • QQ客服点击这里给我发消息
客服邮箱