DeepSeek对中国算力产业的影响VIP专享

CONFIDENTIALDeepseek对中国算力产业的影响2025年2月-2-1DeepSeek的技术突破与市场定位目录CONTENT2DeepSeek驱动算力需求变革3算力产业链的重构-3-DeepSeek爆火--C端:Deepseek全球破圈,成为用户规模增长最快的移动AI应用超级app增长1亿用户所用时间App上线后同样天数DeepSeek与ChatGPT移动端全球DAU对比情况-4-DeepSeek爆火--B端:科技巨头积极拥抱DeepSeek-5-DeepSeek明星产品:DeepSeek的LLM模型分为三个版本:基座模型V3、强化推理版R1-Zero、泛化推理版R1-6-DeepSeek爆火的原因:一流的性能表现、大幅降低的算力成本、开源模式DeepSeek的模型架构创新,如MoE和FP8混合精度训练,大幅提升模型性能和训练效率。高性能模型架构创新通过算法创新和硬件优化,DeepSeek以低成本实现高性能,改变AI领域的竞争规则。低成本实现高性能DeepSeek采用开源策略,降低AI技术门槛,促进全球开发者参与,推动技术快速普及和迭代。开源策略推动技术普及-7-一流的性能表现:DeepSeek-V3性能对齐海外领军闭源模型-8-一流的性能表现:DeepSeek-R1性能对标OpenAI-o1正式版•DeepSeek-R1性能比肩OpenAI-o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。•R1在2024年AIME测试中取得了79.8%的成绩,与OpenAIo1的79.2%水平相当。在MATH-500基准测试中,DeepSeek-R1以97.3%的成绩略微超越了o1的96.4%。在编程领域,该模型在Codeforces平台上表现优异。-9-大幅降低的算力成本:训练算力下降90%DeepSeek-V3和R1模型不仅性能出色,训练成本也极低。V3模型仅用2048块H800GPU训练2个月,消耗278.8万GPU小时。相比之下,Llama3-405B消耗了3080万GPU小时,是V3的11倍。按H800GPU每小时2美金计算,V3的训练成本仅为557.6万美金,而同等性能的模型通常需要0.6-1亿美金。R1模型在V3基础上,通过引入大规模强化学习和多阶段训练,进一步提升了推理能力,成本可能更低。-10-API定价下降89%(V3)、96%(R1)-11-开源大模型:打破OpenAI等闭源模型生态DeepSeek不仅开源了R1-Zero和R1两个671B模型,还通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。同时,DeepSeek还修改了产品协议,支持用户进行“模型蒸馏”,即允许用户无限制商用,鼓励蒸馏(用R1输出结果训练其他模型),尽可能降低用户使用壁垒,全球范围出圈和更容易建立起广泛繁荣的用户生态。DeepSeekV3与R1模型实现了开源,采用MIT协议。这产生多方面影响:•对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了OpenAI与Anthropic等高级闭源模型的封闭生态。DeepSeekR1在多个测试指标中对标OpenAIo1,通过模型开源,也将大模型平均水平提升至类OpenAIo1等级。•对下游生态:优质的开源模型可更好用于垂类场景,即使用户针对自身需求蒸馏,或用自有数据训练,从而适合具体下游场景;此外,模型训推成本降低,将带来使用场景的普及,带动AIGC、端侧等供给和需求。-12-1DeepSeek的技术突破与市场定位目录CONTENT2DeepSeek驱动算力需求变革3算力产业链的重构-13-中国智能算力市场规模持续增长,算力中心从训练侧向推理侧转移中国人工智能服务器工作负载预测,2022-202742%59%35%33%30%28%58%41%65%67%70%72%0%10%20%30%40%50%60%70%80%90%100%202220232024202520262027推理训练中国智能算力规模及预测,(FP16)2604177251,0371,4602,020202220232024202520262027+41%智能算力-14-训练算力头部集中,推理算力爆发式增长头部企业仍持续加码大模型训练,追求更高性能的AGI目标。•阿里:未来3年的AIinfra投资,超过去10年的infra投资•字节:24年资本开支800亿元,接近百度、阿里、腾讯三家的总和(约1000亿元)。25年,字节资本开支有望达到1600亿元,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备。•百度:在2月11日的阿联酋迪拜WorldGovernmentsSummit2025峰会上,百度创始人李彦宏提到,百度需要继续在芯片、数据中心和云...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

碳中和
已认证
内容提供者

碳中和

确认删除?
回到顶部
微信客服
  • 管理员微信
QQ客服
  • QQ客服点击这里给我发消息
客服邮箱