请务必阅读正文之后的免责声明及其项下所有内容证券研究报告|2025年03月11日优于大市人工智能周报(25年第10周)阿里巴巴发布并开源推理模型QwQ-32B,国产AIAgent产品Manus发布核心观点行业研究行业周报互联网优于大市维持证券分析师:张伦可证券分析师:陈淑媛0755-81982651021-60375431zhanglunke@guosen.com.cnchenshuyuan@guosen.com.cnS0980521120004S0980524030003证券分析师:王颖婕证券分析师:张昊晨0755-81983057wang...
DeepSeek-R1\Kimi1.5及类强推理模型开发解读北大对齐小组陈博远北京大学2022级“通班”主要研究方向:大语言模型对齐与可扩展监督https://cby-pku.github.io/https://pair-lab.com/2Outline➢DeepSeek-R1开创RL加持下强推理慢思考范式新边界➢DeepSeek-R1Zero及R1技术剖析➢Pipeline总览\DeepSeek-V3Base\DeepSeek-R1Zero及R1细节分析➢RL算法的创新:GRPO及其技术细节➢DeepSeek-R1背后的InsightsTakeaways:RL加持下的长度泛...
请阅读最后评级说明和重要声明-20%-10%0%10%20%30%40%50%000300.SH515070.SH投资要点➢➢➢➢➢2一、低成本、高性能、强推理三位一体,DeepSeek模型持续迭代升级....................................31.DeepSeek模型密集更新,用户数将持续高速增长....................................................................................32.低成本:DeepSeek位于模型性价比最优范围,较OpenAI等同类模型大幅下降................