Ideepseek大模型生态报告赛迪研究院电子信息研究所2025年2月I目录一、DeepSeek大模型背景.......................1(一)深度求索公司情况...................1(二)模型迭代历程.......................2(三)研发团队情况.......................31.北京大学罗福莉............................................42.北京大学高华佐............................................43.北京邮电大学曾旺丁....................................54.北京大学朱琪豪............................................55.北京大学代达劢............................................66.北京大学王炳宣............................................67.浙江大学梁文锋............................................7二、DeepSeek大模型应用现状...................8(一)国内情况...........................8(二)全球情况..........................10三、DeepSeek大模型技术特点..................11(一)技术创新..........................111.压缩:从结构到量化..................................11(1)多层注意力MLA...........................12(2)FP8混合精度训练框架................132.并行:对硬件的极限使用..........................16(1)DualPipe跨节点通信.....................16(2)无辅助损失的负载均衡策略.........18(3)底层通信优化.................................203.总结..............................................................20(二)训练成本..........................21四、DeepSeek大模型产业生态..................22(一)企业..............................22II1.DeepSeek系列新模型正式上线昇腾社区,华为小艺已接入DeepSeek..........................................222.三大运营商全面接入DeepSeek.................233.多家公司宣布接入DeepSeek.....................234.微软、英伟达、亚马逊全部接入DeepSeek!....................................................................................255.燧原科技实现全国各地智算中心DeepSeek的全量推理服务部署...............................................266.多家券商也积极“拥抱”DeepSeek..........26(二)生态..............................271.Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜..................272.DeepSeek在开源社区GitHub上的Star数首次超越OpenAI.........................................................283.国家超算互联网正式上线DeepSeek.........294.传DeepSeek正准备适配中国国产GPU...295.DeepSeek的风,火速吹遍了终端企业......30(三)应用..............................321.文学..............................................................322.编程..............................................................32(四)基础设施..........................35五、DeepSeek大模型产业影响..................35(一)对人工智能技术的影响..............351.吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径.........................352.蒸馏技术将成为行业突破口......................36(二)对产业生态的影响..................371.DeepSeek开源对于企业战略价值..............372.DeepSeek是否真的绕开了CUDA?.........393.DeepSeek会导致对智算中心的需求大幅减少吗?........................................................................39III(三)对国际竞争的影响..................461.DeepSeek的崛起,冲击了全球科技供应链的核心玩家...................................................................462.AI低成本化,最大输家可能不是Nvidia,而是依赖大模型收费的AI公司.................................463.AI进入创业黄金时代..................................474.DeepSeek的崛起引发了全球资本市场的剧烈震荡.....................