我们该如何看待DeepSeek——what, how, why, and next?VIP专享

我们该如何看待DeepSeek——what,how,why,andnext?陈果湖南大学信息科学与工程学院教授国家超级计算长沙中心常务副主任声明:1.仅代表个人观点,不代表任何机构立场;2.面向不具备AI专业知识背景的群体,为保持易懂性简化了很多技术细节,且不求涵盖所有方面;3.主要以R1模型视角讲解,其他模型在第三大块有简要介绍;4.受个人研究领域及认知水平所限,难免有疏漏或偏颇之处,欢迎批评指正。提纲◼Whatisit:DeepSeek是什么从ChatGPT到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)◼Howtouseit:我能用DeepSeek干什么以小见大,掌握思维方法正确理解,打开广阔天地◼Whyitworks:DeepSeek背后的原理Transformer——大模型基础DeepSeek模型的发展历程◼Next:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注2提纲◼Whatisit:DeepSeek是什么从ChatGPT到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)◼Howtouseit:我能用DeepSeek干什么以小见大,掌握思维方法正确理解,打开广阔天地◼Whyitworks:DeepSeek背后的原理Transformer——大模型基础DeepSeek模型的发展历程◼Next:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注3从ChatGPT开始4故事从ChatGPT说起5◼ChatGPT的诞生在全球范围内引爆人工智能(AI)相当数量的人(圈内人、技术潮人为主)开始切身感受到AI带来的巨大冲击https://www.thepaper.cn/newsDetail_forward_21909720https://blog.csdn.net/qq_73332379/article/details/129861428https://medium.com/@lmpo/大型语言模型简史-从transformer-2017到deepseek-r1-2025-cc54d658fb432022年11月30日OpenAI发布对话式AI模型ChatGPT两个月用户破亿ChatGPT背后的方法6◼生成式人工智能(AIGC)和大语言模型(LLM,也简称大模型)ChatGPT用于聊天、对话Generative生成式,模型的输出方式Pre-trained预训练,模型的制造方法Transformer模型结构生成式人工智能(AIGC)支撑实现大语言模型(LLM)技术原理ChatGPT真正做的事:文字接龙7https://speech.ee.ntu.edu.tw/~hylee/index.phpChatGPT真正做的事:文字接龙8https://speech.ee.ntu.edu.tw/~hylee/index.php输出又送回输入,不断迭代接龙输出又送回输入,不断迭代接龙ChatGPT真正做的事:文字接龙9https://speech.ee.ntu.edu.tw/~hylee/index.phpChatGPT真正做的事:文字接龙10https://speech.ee.ntu.edu.tw/~hylee/index.php◼这就是为啥LLM经常出现“幻觉”LLM怎么学习文字接龙?11https://speech.ee.ntu.edu.tw/~hylee/index.php人们开始相信AI会真正变革我们的生活12◼ChatGPT可以自然对话、精准问答,生成代码、邮件、论文、小说。。。•写一篇信创产业的研究报告•用鲁迅口吻写篇“长沙春天”的散文•用C++写一段爬虫代码•翻译•心理咨询建议•代码阅读理解和DEBUG从ChatGPT到OpenAIO系列13推理大模型开始走入视野:OpenAIo1◼2024年9月12日,OpenAI官方宣布了OpenAIo1推理大模型。◼OpenAI宣称OpenAIo1大模型推理(Reasoning)能力相比较当前的大语言模型(GPT-4o)有了大幅提升。由于OpenAIo1模型的训练使用了一种新的AI训练方法,强调了“思维链”过程和强化学习的重要性,最终导致它在数学逻辑和推理方面有了大幅提升,大家开始称这里有思考过程的大模型为推理大模型。14什么是推理模型15普通模型和推理模型的对比https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms什么是推理模型16一个推理案例https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms推理模型和非推理模型的区别非推理模型直接生成答案17推理模型和非推理模型的区别18推理模型一步一步推导推理模型在一些领域优势明显19◼数学、代码、逻辑等领域优势明显美国数学邀请赛编程竞赛平台生物物理化学难题数据集◼还有算力scaling方面的独特优势,后面再说DeepSeekR1厉害在哪里此处仅介绍一部分,DeepSeek带来的更多的意义和启示在最后一章20DeepSeekR1的意义1.首个展示思维链过程的推理模型2...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

碳中和
已认证
内容提供者

碳中和

确认删除?
回到顶部
微信客服
  • 管理员微信
QQ客服
  • QQ客服点击这里给我发消息
客服邮箱