ChatGPT-AIGC+重磅上市公司和行业专家访谈合集-久谦咨询-69页VIP专享VIP免费

http://research.meritco-group.com 久谦 | 服务进步的群体 | 1
ChatGPT 第二批纪要合集
ChatGPT 的发展前景 ........................................................................................................................................................ 2
ChatGPT 对国内产业的影响 ............................................................................................................................................ 9
ChatGPT 发展路径和竞争力 .......................................................................................................................................... 17
ChatGPT 技术壁垒和国产替代 ...................................................................................................................................... 19
投资人谈 ChatGPT .......................................................................................................................................................... 24
ChatGPT 算力知多少 ...................................................................................................................................................... 29
ChatGPT 算力需求测算 .................................................................................................................................................. 32
ChatGPT 开启 AI 纪元 ................................................................................................................................................. 37
ChatGPT 掀起 AI 业新周期 ......................................................................................................................................... 40
汤姆猫访谈纪要 ............................................................................................................................................................. 42
微软加速 ChatGPT 落地 ................................................................................................................................................. 44
小冰访谈纪要 ................................................................................................................................................................. 47
中文在线访谈纪 ......................................................................................................................................................... 49
数码视讯访谈纪 ......................................................................................................................................................... 50
汉王科技访谈纪 ......................................................................................................................................................... 53
科大讯飞值得关注的 AI 应用方向 ................................................................................................................................ 56
同花顺 AI 应用方向 ........................................................................................................................................................ 65
http://research.meritco-group.com 久谦 | 服务进步的群体 | 2
ChatGPT 的发展前景 2/14
核心观点
1 AI 行业还是在成长期,目前在 A股的投资更多还是主题投资阶段。今年科技一定
是会有持续行情
2 深层次 AI 行业里面,大概是四类角色
3 AIGC 投资可以关注四个层面
4 现在 AI 行业有点像五年前甚至十年前的新能源行业
5 未来买数字化,很多时候你可能也要买传统行业的公司,它会是一种双向奔赴
6 科技股未来投资方向,最看好还是数字经济方向,分两块
ChatGPT 是当下大热的一个话题,国外的相关公司可能领先了小半年,他们的发展情
况或者他们各自有什么样的特点、优势,可以大概给我们分享一下吗?
1 这个爆款的应用来自于 OPENAI,它最早创始的时候,包括像马斯克等很多美国科
技巨头参与在其中,而且它甚至不以盈利为目的,是一个类似于科研类的组织
a 后来微软看到它的发展非常好,实际上最近也有再投入。所以它跟微软自身的
AI 在这方面的布局结合的非常紧密。微软后面会推全家桶,就是微软将搜
跟这个相结合,使它变成超级搜索或者超级引擎的落地的场景
b 再包括其实微软最擅长的还是 Office,就是在办公场景下,比如 Word
Excel,其实我们过去用了很多年的工作习惯很有可能会再有一个大的功能上的
跃升,就是跟 AI 相结合。可能我们写作的效率,甚至刚刚谈到的一些题例
的文章,它都能完成基本撰写
c Office 过去也有大量的比如文本校验等功能,但其实还是非常基础的。这次
结合了 AI,它真的就相当于一个审核或者高级校验的角色,比如对你提供一
数据,逻辑的梳理、验证等等
2 这是微软在这一块儿有很明确的跟存量的搜索引擎、办公软件相整合,其实它已
经从 AI 的模型阶段延伸到应用阶段
a 但是 Google 也在推 Bard 机器人,后面可能也会正式发布。当然 Google 过去
是全球引擎行业的巨头,一直在人工智能方面有非常多的投入,目前它的危机
感也比较强
b 另外对应国内这一块,像百度、阿里、字节都有类似的部署
3 但我自己总结为,在整个深层次 AI 行业里面,我觉得大概是四类角色
a 第一是提供底层的基础算力或者云服务的偏硬件层的基础设施,或者云基础设
施的公司。这里面涉及通信或者电子相关的公司会更多一些
b 第二大层是提供大模型或者算法的公司。ChatGPT 或者 OpenAI 是一个非常典
型的做大模型的公司,国外像 OpenAIGoogle 做,当然对应国内像百度
科大讯飞、阿里,这些科技巨头在大模型方面应该会有一些布局,陆陆续续大
家应该也会看到,这是第二层
c 第三层,就是应该会有一些中间层,稍微偏专业或者垂直侧的小模型的公司。
i 其实国内现在也有一些公司已经开始做,它可能基于第二层的大模型来开
发,但是它用底层开源的大模型在上面再做一个垂直细分领域的优势场
景,比如医生或医疗行业,再比如汽车、法律、律师行业等,就是它可能
会做一些垂直模型
ii 对于第二层和第三层的关系,大模型更像 K-12(中小学普世义务教育),
是一个基础层的培养,非常重要。如果这 12 年或者这个部分没有做好,上
面很难长出垂直方向很好的模型
http://research.meritco-group.com 久谦 | 服务进步的群体 | 3
iii 到第三层,有点像大学和研究生阶段,可能要选专业,选一个目标培养方
向。这个阶段不太会大而全,比较难有专业优势
iv 国内可能会有很多公司做这一类,但是它也要基于一个大模型,在大模型
的这一端,最终不太会有非常多的公司做,可能会是一个相对更大的,因
为它对算力算法的要求还是蛮高的
d 最后一层量会更大的就是应用层的公司。有点像毕业了,你要工作了,你有了
很好的知识,真的从一K-12 教育走向大学教育,甚至研究生教育,最后我
要到实践中创造生产力或者创造价值,那可能走向各行各业的 AI 的应用。
i 这类公司在国内现在也开始有一些比如游戏行业、搜索引擎,甚至将来的
人形机器人等等,会有很多场景
ii AI 有点像五年前甚至十年前的新能源
OpenAI 能否成为一个现象级的公司,类似特斯拉,以及由此带来的 AI 能够成为类似
新能源行业,它的这个行情将会非常大?
1 坦白讲如果现在一定要去判断这两家公司的空间有多大,现在确实还有点早。因
OPENAI 这家公司最早设立的时候可能不是以盈利商业机构为目的,它更多的还
是在创新上面做探索
a 从这点来看,可能特斯拉创立的开始也是一样,它也要在这种颠覆式创新上有
它的独到之处,或者它设计的初衷就是改变人类现有的对科技的线性的理解。
可能会有第一性原理,就是可能会有一个全新的颠覆式创新,这点是相通的。
b 但是如果从行业的阶段上来比,现在 AI 行业跟新能源的成熟度肯定是完全不
同的,有点像五年前甚至十年前的新能源行业
c 当然中间新能源行业也经历过从最早的技术萌芽到产业的成长,像 Gartner
线中讲到的任何一种技术至少都会经历五个阶段,从技术的萌芽到快速成长,
然后到泡沫期,就是资本或者整个创业者会非常疯狂的涌入这个领域,很多技
术都会经历这样的阶段,然后到泡沫的破裂
2 泡沫破裂之后就进入去伪存真,就是真正做这件事情的人可能会留下来。但有时
候最终到这个阶段可能有一些就扛不住、会被淘汰,那才会进入最后一个周期,
就是真正的成熟期。在成熟期,才会有更多的收入、利润、业绩的体现,基本上
都会经历这样五个阶段
a 如果套用这样的模型,毫无疑问特斯拉、新能源行业在今天其实已经走到了相
对比较成熟的阶段,所以它已经在各种财务指标上或者分析师模型里通过销量
或者成本模型,能够计算或者预测它的利润,然后给予它一个估值去定价
b 但如果回到这个模型,AI 现在处在什么阶段,或者 AI 不同的决策式、生成式
可能处在不同的阶段,但整体来讲,AI 行业还是在成长期。当然,有些部分
至可能在泡沫期,就是大家很热的涌到这个领域
c 按照正常的模型,它后面还有三大阶段要走,所以从发展阶段上来讲,跟新能
源行业还是不能相提并论,对应的估值模型肯定也是完全不一样的
3 映射到投资上来看,我个人觉得目前在 A的投资更多还是主题投资阶段,但主
题投资相对于价值投资并没有更优
a 其实在科技行业,很多新技术一开始都是主题投资的阶段,因为这个阶段会有
对未来比较大的想象空间,同时行业的竞争格局没有那么固化,这时可选的标
的或者很多公司都会有一种朦胧美,就是我们认为它可能都有做成的可能
b 像电动车行业现在也处在这个阶段,就是你现在还没有分化。但比如消费电子
其实已经有龙头出来了,那我们就要更多关注它的收入、利润。但其实很多产
业现在确实还处在一个板块式的行情中,AI 今年应该还是处在这样的阶段。
ChatGPT第二批纪要合集ChatGPT的发展前景........................................................................................................................................................2ChatGPT对国内产业的影响............................................................................................................................................9ChatGPT发展路径和竞争力..........................................................................................................................................17ChatGPT技术壁垒和国产替代......................................................................................................................................19投资人谈ChatGPT..........................................................................................................................................................24ChatGPT算力知多少......................................................................................................................................................29ChatGPT算力需求测算..................................................................................................................................................32ChatGPT开启AI新纪元.................................................................................................................................................37ChatGPT掀起AI产业新周期.........................................................................................................................................40汤姆猫访谈纪要.............................................................................................................................................................42微软加速ChatGPT落地.................................................................................................................................................44小冰访谈纪要.................................................................................................................................................................47中文在线访谈纪要.........................................................................................................................................................49数码视讯访谈纪要.........................................................................................................................................................50汉王科技访谈纪要.........................................................................................................................................................53科大讯飞值得关注的AI应用方向................................................................................................................................56同花顺AI应用方向........................................................................................................................................................65ChatGPT的发展前景2/14核心观点1AI行业还是在成长期,目前在A股的投资更多还是主题投资阶段。今年科技一定是会有持续行情2深层次AI行业里面,大概是四类角色3AIGC投资可以关注四个层面4现在AI行业有点像五年前甚至十年前的新能源行业5未来买数字化,很多时候你可能也要买传统行业的公司,它会是一种双向奔赴6科技股未来投资方向,最看好还是数字经济方向,分两块ChatGPT是当下大热的一个话题,国外的相关公司可能领先了小半年,他们的发展情况或者他们各自有什么样的特点、优势,可以大概给我们分享一下吗?1这个爆款的应用来自于OPENAI,它最早创始的时候,包括像马斯克等很多美国科技巨头参与在其中,而且它甚至不以盈利为目的,是一个类似于科研类的组织a后来微软看到它的发展非常好,实际上最近也有再投入。所以它跟微软自身的AI在这方面的布局结合的非常紧密。微软后面会推“全家桶”,就是微软将搜索跟这个相结合,使它变成超级搜索或者超级引擎的落地的场景b再包括其实微软最擅长的还是Office,就是在办公场景下,比如Word、Excel,其实我们过去用了很多年的工作习惯很有可能会再有一个大的功能上的跃升,就是跟AI相结合。可能我们写作的效率,甚至刚刚谈到的一些题例式的文章,它都能完成基本撰写c像Office过去也有大量的比如文本校验等功能,但其实还是非常基础的。这次结合了AI,它真的就相当于一个审核或者高级校验的角色,比如对你提供一些数据,逻辑的梳理、验证等等2这是微软在这一块儿有很明确的跟存量的搜索引擎、办公软件相整合,其实它已经从AI的模型阶段延伸到应用阶段a但是Google也在推Bard机器人,后面可能也会正式发布。当然Google过去是全球引擎行业的巨头,一直在人工智能方面有非常多的投入,目前它的危机感也比较强b另外对应国内这一块,像百度、阿里、字节都有类似的部署3但我自己总结为,在整个深层次AI行业里面,我觉得大概是四类角色a第一是提供底层的基础算力或者云服务的偏硬件层的基础设施,或者云基础设施的公司。这里面涉及通信或者电子相关的公司会更多一些b第二大层是提供大模型或者算法的公司。ChatGPT或者OpenAI是一个非常典型的做大模型的公司,国外像OpenAI、Google会做,当然对应国内像百度、科大讯飞、阿里,这些科技巨头在大模型方面应该会有一些布局,陆陆续续大家应该也会看到,这是第二层c第三层,就是应该会有一些中间层,稍微偏专业或者垂直侧的小模型的公司。i其实国内现在也有一些公司已经开始做,它可能基于第二层的大模型来开发,但是它用底层开源的大模型在上面再做一个垂直细分领域的优势场景,比如医生或医疗行业,再比如汽车、法律、律师行业等,就是它可能会做一些垂直模型ii对于第二层和第三层的关系,大模型更像K-12(中小学普世义务教育),是一个基础层的培养,非常重要。如果这12年或者这个部分没有做好,上面很难长出垂直方向很好的模型iii到第三层,有点像大学和研究生阶段,可能要选专业,选一个目标培养方向。这个阶段不太会大而全,比较难有专业优势iv国内可能会有很多公司做这一类,但是它也要基于一个大模型,在大模型的这一端,最终不太会有非常多的公司做,可能会是一个相对更大的,因为它对算力算法的要求还是蛮高的d最后一层量会更大的就是应用层的公司。有点像毕业了,你要工作了,你有了很好的知识,真的从一个K-12教育走向大学教育,甚至研究生教育,最后我要到实践中创造生产力或者创造价值,那可能走向各行各业的AI的应用。i这类公司在国内现在也开始有一些比如游戏行业、搜索引擎,甚至将来的人形机器人等等,会有很多场景iiAI有点像五年前甚至十年前的新能源OpenAI能否成为一个现象级的公司,类似特斯拉,以及由此带来的AI能够成为类似新能源行业,它的这个行情将会非常大?1坦白讲如果现在一定要去判断这两家公司的空间有多大,现在确实还有点早。因为OPENAI这家公司最早设立的时候可能不是以盈利商业机构为目的,它更多的还是在创新上面做探索a从这点来看,可能特斯拉创立的开始也是一样,它也要在这种颠覆式创新上有它的独到之处,或者它设计的初衷就是改变人类现有的对科技的线性的理解。可能会有第一性原理,就是可能会有一个全新的颠覆式创新,这点是相通的。b但是如果从行业的阶段上来比,现在AI行业跟新能源的成熟度肯定是完全不同的,有点像五年前甚至十年前的新能源行业c当然中间新能源行业也经历过从最早的技术萌芽到产业的成长,像Gartner曲线中讲到的任何一种技术至少都会经历五个阶段,从技术的萌芽到快速成长,然后到泡沫期,就是资本或者整个创业者会非常疯狂的涌入这个领域,很多技术都会经历这样的阶段,然后到泡沫的破裂2泡沫破裂之后就进入去伪存真,就是真正做这件事情的人可能会留下来。但有时候最终到这个阶段可能有一些就扛不住、会被淘汰,那才会进入最后一个周期,就是真正的成熟期。在成熟期,才会有更多的收入、利润、业绩的体现,基本上都会经历这样五个阶段a如果套用这样的模型,毫无疑问特斯拉、新能源行业在今天其实已经走到了相对比较成熟的阶段,所以它已经在各种财务指标上或者分析师模型里通过销量或者成本模型,能够计算或者预测它的利润,然后给予它一个估值去定价b但如果回到这个模型,AI现在处在什么阶段,或者AI不同的决策式、生成式可能处在不同的阶段,但整体来讲,AI行业还是在成长期。当然,有些部分甚至可能在泡沫期,就是大家很热的涌到这个领域c按照正常的模型,它后面还有三大阶段要走,所以从发展阶段上来讲,跟新能源行业还是不能相提并论,对应的估值模型肯定也是完全不一样的3映射到投资上来看,我个人觉得目前在A股的投资更多还是主题投资阶段,但主题投资相对于价值投资并没有更优a其实在科技行业,很多新技术一开始都是主题投资的阶段,因为这个阶段会有对未来比较大的想象空间,同时行业的竞争格局没有那么固化,这时可选的标的或者很多公司都会有一种朦胧美,就是我们认为它可能都有做成的可能b像电动车行业现在也处在这个阶段,就是你现在还没有分化。但比如消费电子其实已经有龙头出来了,那我们就要更多关注它的收入、利润。但其实很多产业现在确实还处在一个板块式的行情中,AI今年应该还是处在这样的阶段。c所以对应到投资机会上或者从OpenAI自身来讲,影响估值的更多的可能不是它的收入、利润当前我们应该看什么指标?因为对于成长性公司的股指,可能您在TMT领域还是非常驾轻就熟的,但是对于一些比如偏重于成熟型公司投资的投资人来说,可能还不是太了解?1其实在主题阶段,其实最近这个行情之所以能一直持续,跟海外巨头持续在这个部分有很多动作有很大关系a比如微软会再投100亿美金进去,但实际上除了微软之外,Google马上也会动起来,它也要发它的模型,然后也没有商业化计划,同时别的产业链上下游的巨头其实也都在动。国内也一样,像百度三月份也会推出“文心一言”b这可能对行情都会有一个持续的催化,就是从主题上来讲它需要持续有新的东西,但是短期可能在PE和PS上不一定有很明确的指向,但是它也有可能会在比如用户量上有进一步的跃升c包括OpenAI自身在这个阶段还没有推专门的付费版本,我个人觉得可能未来会有两种收费模式。一种是对于中小企业来讲,更多的是用云端调用它的接口;另一种是对于大型企业,它可以本地化部署,这样我也可以直接付费或直接收费。所以整体来讲,从爆款的应用到用户的暴增到收入阶段,还是能看到的2最怕的是对于一个初创型的行业,大家一定要看利润,反过来对于一个很成熟的行业,大家又觉得可以看商业模式或者数据,实际上还是要用适宜它的方法去给它估值,其实还要有多样化的审美,这也是注册制以后可能A股要面临的,在科技投资方面非常重要AIGC可想象的空间很大,但如果从投资角度来看我们可以提前布局,将来可以关注哪些投资方向?1可能有这几个层面,倒着来看还是可以从刚刚提到的四个层面来理解。它是一个“倒金字塔”的结构,就是越往应用层越分散,应用层面应该是百花齐放的,它可以容纳很多小公司,这个行业集中度不会太高,这是第一大类2第二层就是在“小模型”这一层,或者比喻为上大学和研究生的阶段训练。这个部分应该会有很多大公司做,但很多有数据、有场景优势的公司也可以做a比如我在图片行业或者音乐行业有大量的版权、原始数据,那它可能也会有,因为这个板块相关公司的核心壁垒第一个肯定要有基础的算法优势,但更重要的是它要有数据,就是要有很多原创数据b那就去挖掘哪些是有场景、有数据的公司,这部分也有投资机会3第三层就是“大模型”,前面也有提到,这里就不再展开4第四层,就是提供底层算力、云基础和相关支撑的公司52022年年初,国务院发了一个有关数字经济十四五规划。“十四五”规划中在对数字经济定义时提到“数据要素是核心生产力”,这就有点像“未来的石油”,我可以通过石油加工出很多如尼龙、化工行业的东西,未来数据也一样a所以从这点来讲,提供底层算力的公司可能不会是涉及面很多的公司,因为它是一个门槛相对比较高的行业,现在像做云计算、做通信、做技术支持服务还是一些大公司或国资类的公司比较多,但是它的确定性会很高b底层有关的这种“云”,不管是IDC服务、网络服务、提供ICT设备,甚至是CPU和GPU(芯片)都会受益。它可能没有前面提到的那些应用、做模型的公司那么直接,但反过来讲,它的确定性会很高。工业数字化投资确定性很高,未来传统行业公司也要买在数字经济发展中,新型的基础设施建设、硬件设备、软件开发、应用场景可能都有爆发点,哪些领域有望率先突破?1未来十年,数字经济最根本的是把数据作为生产的一个要素,把AI作为生产工具,这跟过去十年不同,过去十年是网络和信息化a如果这样,我认为首先在应用端或者未来最重要的抓手应该是谁能把数据用好,谁能用AI的工具创造新的生产模式或新的应用场景,这是数字经济的最根本b当然,数字化的前提是云化。云化就是如果它都没有上云,数据都是离线的,或者生产数据、管理数据可能没有全部在线或在云上,这很难称之为数字化企业,所以从这点来讲,云计算肯定还是确定性很大的。所以这两年云背后包括存储、服务器,实际上是对算力的支撑2另外在数字化投资里,各地有各种东西出来可能和过去十年还会有很大不一样。过去十年,互联网时代更多的是TOC的场景比较成功,C是“CONSUMER”,就是更多改变我们的生活,比如社交、电商还是对生活质量的提升,让我们的生活更加便利3但未来十年在数字化里面,本质上还是TOB的场景,B就是生产,实际上会对它有更大的跃升,比如数字化在智能制造,在制造业里面对降本增效的效果。现在对企业来讲,数字化可能不是一个选择题,而是一个必修题,就是如果你不做,可能未来你的商业模式就要被干掉4在过去一段时间,汽车行业就是非常典型的,电动车来了以后,汽车供应链都重组了。汽车供应链以前都讲TIER1供应商,但它不是一个垂直化的、定制的生产模式,这就是一个很传统的制造业生产模式的改变a汽车可能不是最后一个在能源行业的数字化行业,我们当时研究数字化场景时发现一个很有趣的现象,就是越集中度高、越传统的行业反而越容易数字化,而供给侧改革过的行业会更容易数字化,为什么?b因为它的行业结构相对巨头林立,产业分工很清晰。比如煤炭、钢铁、有色拥抱数字化的态度非常积极,行业竞争格局已经很清晰c想再提效率或者有增长,那就要有新的工具和技术手段。反而对于一些比较分散或者集中度没那么高的行业,比如医药行业好像就没有那么快,因为它的中间环节还很多d这是汽车能源,当然中国还有一块非常大的机会就是工业,就是去年二十大报告提到的新型工业化。新型工业化的背后,工业数字化就是很大一块,在投资上的确定性都很高e所以我去年提出一个观点,以前投数字化或者投科技就是投TMT行业本身,大家去买那些做IT、做CT、做芯片的公司。但未来买数字化,很多时候你可能也要买传统行业的公司,它会是一种双向奔赴那会不会像我们之前理解的互联网+,就是在传统行业的颠覆上,互联网这个应用各个行业都开始了,也颠覆了传统行业,会类似吗?1会类似,但是我不会用一个词叫“颠覆”a原来在ToC的领域确实是颠覆,就是零售行业做大会对传统的线下零售有很大影响。但是这次ToB或者跟很多传统行业的融合,TMT,就是单纯做技术的公司,还是挺难颠覆的b因为在一生产场景,相比于一个消费场景,首先它是非标准化的,就是每个场景长得都不一样,所以你很难出现一个巨头,在互联网时代赢家通吃c但是ToB不会,比如在制造业和医疗行业可能完全不同,它的know-how(场景)完全不同,这个时候如果传统行业的公司能够用好AI,用好新的数字化工具,它可能会更有优势d数字化可能会成为一个基本工具,所以这点很多传统行业现在还处在估值比较低的位置,比如能源行业、工业中也有很多非常优秀的巨头已经开始全面拥抱数字化2过去一年疫情中大家对数字化还是保持非常开放的心态,过去它觉得你要颠覆我,甚至是一种排斥,现在因为整个经济增速放缓过程中,大家觉得这可能会是一个非常重要的工具让自己重生,所以企业主愿意在这上面进行投入,它会对整个行业的推动起到很重要的作用那会不会在集中度比较高的如国企领域,或者在偏垄断、竞争不激烈的行业率先发生?1如果按行业分,TOC先不说,在TOB的场景因为有很大,更大的如分服务业的数字化,农业、工业等,稍微小一点工业里面又分很多种,但整个研究下来,首先中国的产业数字化水平比全球低2其实就是在TOC互联网里很发达,在消费部分发达,但是在生产的部分相比于美国、德国、日本,他们的渗透可能都在60%以上,我们可能只有百分之三十几,这个本来就是要低一些,所以空间会比较大3第二个单就在产业数字化的场景里面,就是TOB的行业里面,我刚刚举了三个比较看好的方向——汽车、工业、能源,它的行业集中度相对比较高,对产业链分工比较清晰,巨头或者龙头对行业的技术和模式创新引领就达成共识,这是比较好的场景。当然,比如金融行业也在发生类似的事情,也会延伸包括一些现代服务业等在AI发达的时代,我们如何分享科技股的盛宴。近期在券商的策略会当中,大家集中看好科技股,科技股也已经有了不小的涨幅,未来您怎么看?1上次你们办论坛的时候,我其实还是坚定的看好,我当时有三点理由a第一个是本身技术变迁到了一个新周期的开始。TMT的每一轮行情最重要的因素可能不是估值,因为它足够便宜,当然这肯定是其中一个很重要的因素,但不是唯一的因素i最底层的因素应该是到底有没有质的技术创新,就是现象级的应用,或者有没有爆款的东西出来。其实2015年那一波科技行情,移动互联网的爆款应用出来很多,包括后来像抖音、快手这样爆款的现象级的应用ii现在又有现象级的应用出来,而且它到上亿用户的速度可能是历史上最快的,只用两个月时间,这是一个很重要的标志,就是它需要有全新的、让人感觉很兴奋的东西出来,而这种东西可能是一个颠覆式的创新,当然过去几年科技有很多场景有点低预期,那就没有达到想象iii但是这次AI在这个方向其实是有超预期的表现,这是一个很重要的驱动科技股的因素。当然,如果基于这个模型,后续还有没有爆款应用出来,是有可能的b第二个影响科技股行情最根本的因素是流动性,我去年提到美联储加息的趋势停止,其实这也很重要。因为总体来讲,确实在整个估值体系里面,科技股历来是估值比较贵的,但是它贵背后有一个“G”(Growth),就是有增长在里面i所以我更习惯于去看PEG,而不是简单的看动态PE更有价值。就是相比于15倍估值,但是只有15%增长的东西,我更愿意选择一个50倍估值,但是有百分之百增长的东西。这是典型的科技研究员的审美,一定是要有增长、有变化、有未来潜在的非线性的拐点ii像当年亚马逊大概有十年只有收入的增长,但AWS没有利润的增长,但它一旦开始盈利以后,你会发现收入可能每年增长50%,但利润增长百分之百,然后毛利率或者利润率有一个边际成本迅速下降,软件、互联网行业其实都有这样的特点iii所以这是第二个审美的重点,就是它今年有一个流动性的优势,同时最新的流动性的溢价会更直接的体现在科技股上,当然在去年那样反向的时候就会更痛苦c最后一点,从今年整个A股来看,确实在科技股的投资板块上,估值还是有一些吸引力。因为从2018年的四季度应该是一个低点,但经过后来2019、2020年有一轮反弹,但总体来讲跟2018年以前还是有差距的d就是实际上高的时候看2018年之前,像今天很热的计算机行业在火的时候,实际上也有50倍以上的估值中枢的阶段,但是其实我们就觉得50倍可能很贵e相比于2013、2014年非常疯狂的阶段,还处于中位数,估值还有一定空间,没有拥挤到已经泡沫化了,那可能确实后面会比较难2所以基于以上三点,今年科技一定是会有持续行情从这三点来看,或者结合一些历史数据,您觉得科技股的牛市一般会持续多久?1其实还是取决于前面几个因素,要不断有新东西出来。比如移动互联网,就是3G那一波,大概从2012年游戏作为第一个爆款应用出来到2015年大概有三、四年的时间2再看2018年的半导体,其实就是以信创、自主可控为代表,也有差不多三年时间。当然可能结构会不一样,我以前经常讲“硬三年,软三年,商业模式再三年”的周期性,过去几年其实更多的还是在硬件上长期逻辑不看新鲜概念或主题,怎么把握未来5到10年科技股的投资方向呢?1简单总结,我最看好的还是数字经济方向。数字化其实是一个周期比较长、确定性很高的东西2具象一点,可能有几个板块,数字经济就是两大块a第一大块是数字产业化。就是TMT行业本身会有一些基础设施部分(新基建),这个部分确定性比较高的像云计算,现在它又是一个需求跃升或者拉动的过程刚刚开始,对应到不管是做云自身的公司,还是做云基础设施的,像配套设备或者是里面的芯片、ICT设备的公司,它会受益b第二个在基础设施部分我比较看好的还是大安全的主线i现在在科技的自主可控,以及信创,包括网络安全,它是一个不仅仅因为全球竞争的问题,其实也有应用从ToC走向ToB,它自然会对安全的要求很高ii所以在相关的比如网络安全、底层设备的投入上,它对安全的要求就会更高,从这点上信创板块应该还有确定的机会c最后就是在产业数字化方面,在应用端下一个爆款的应用会在哪里,这也是大家所关注的。但整体来讲,可能ToB的机会会大一些d这三类未来都会产生投资机会,但不一定会是那种千亿市值的特别大的公司,ToB的应用可能会容纳一些专精特性,小而美的公司也会很多,因为它往应用端去走。但是在数字产业化,就是提供云基础设施这一方面会有一些大公司。现在已经有一些大公司了,无非是这些大公司能不能从千亿市值涨成更大市值,成长空间到底有多大5G的建设目前是不是到了中后期,它的投资逻辑是否发生变化,未来怎么看?1关于5G我之前总结了两句话,第一句话是从新基建走向新应用。这个观点很明确,就是基建的投资肯定是告一段落2下一步我们要思考怎么用好这么好的基础设施,就是这么好的高速公路修通了,我怎么保留大量的车来走a硬件和软件没有孰优孰劣之分,它是一个螺旋式创新,所以今年5G的应用就很重要。到底有没有一些好的应用,比如自动驾驶、工业互联网、VR、AR,这是5G潜在的一些比较大的场景b所以从新基建走向新应用,在5G的投资上今年应用的机会应该更多。3第二个,在投资上要注意从终端走向云端,这个可能听起来比较绕,但很好理解a过去产业链的价值是承载在终端上的,比如我们买一个手机、电脑很贵,而且我们会关注它的内存、CPU指标。但现在我们买手机有可能关注它的屏幕大不大、摄像头多不多,原因是什么呢b算力或者计算的功能是在云端的,承载在云上面的,就是英伟达做的这个工作。因为网速足够快,我的内容没有存在本地,实际上我没有必要存本地。以前大家丢了手机很慌张,现在丢了马上想找回账号密码,其实硬件本身变成一个显示器,所以很好理解c其实你所有产业链的价值量或者算力是在云端的,所以在5G投资上也要注意。以前我们投5G可能大家会关注手机产业链,但现在你可能要关注应用,云端有没有投资机会。再比如汽车,去年对于智能车或者电动车,我们关注硬件本身的投资机会,但接下来的重点应该在自动驾驶和智能座舱ChatGPT对国内产业的影响2/17ChatGPT出来之后,对我们国内相关产业的影响?国内相关的厂商,阿里、百度未来一段时间落地情况?1从国家层面,GPT这个产品推出以后,网信办已经发出了一些政策相关的东西a从国家层面的角度来说,短期内我们很难看到ChatGPT这些产品直接跟国内的应用,或者做比较深度的结合,因为这块不管是基于信息安全,还是国内的一些产业保护的角度来说,国内可能都得需要有这样一个窗口期,得需要有逐步缓冲的时间b所以,国家后续会出台相关的政策,给国内的玩家们提供追赶的时机2从我们之前对百度文心类似产品的使用体验来看,内容的质量上百度文心和CHATGPT差距不是特别大,只是在内容的多样性上有差距a咱们国内研究相关的大模型的,目前主要靠工程人员和研发人员,大概几百号人或者上千号人这么研发,在这个过程中没有引入像OpenAI这种用户反馈机制,没有大量的用户在技术模型的迭代过程中参与进来b所以在内容的多样性上会有所欠缺3可能跟目前实际没有放开政策有关系,就是比如像CHATGPT响应能力,一个Q过去,A回来大概是1-3秒,响应能力比较快。目前百度文心这边我们能够体验到的,大概短的在20秒左右,长的甚至在80秒以上4当然这个不是技术瓶颈问题,需要在模型研发完成以后,我需要在服务器做部署,部署完之后支持数以百万计,甚至数以千万计高并发访问的需求,这块属于常态的部分。未来3-6个月左右的时间,像百度文心、阿里推出类似于CHATGPT的产品应该可以达到目前CHATGPT60%-70%左右的水平ChatGPT出来之后,一开始在美国程序圈特别火,比如说从应用层面,或者算力层面有什么样对行业的影响?百度或者其他有没有正在加大投入的?1先说一下整个参与的玩家,只说国内。像百度已经宣布了,阿里达摩院也宣布了会投入3个亿的基金做这块。当然还有我们想不到的,比如说美团前合伙人也宣布下海做这件事情。当然可能在其他的领域,包括您提到的字节,也对之前一些GPT2.0、3.0,可能以开源的模型作为基础,也做了一些相应的优化,也跟这些客户推相关的解决方案2像字节也做了一些优化。主要是训练过程,在云服务架构上,通用的算力部署,大概会有1.5-2.5倍的效率提升。可能跟我们接触的部门有关系,它自己没有单纯的训练大模型,更多的想把服务包给愿意做大模型的公司3这个模型训练的成本主要有三个方面,单纯从基础算力投入这块大概是384块到3,000块左右的A100的投入,基本上可以满足要求。这块的费用大概400-1,000万美金,最多到3,000万美金的规模,所以对于很多巨头、独角兽甚至一些初创团队,其实都有能力做这个投入。而且它的算法的基础都是基于预训练这样一种机制。所以参与的玩家会比我们想象的要多4关于技术跟行业结合的影响,短期内主要是有两个大的方向a一个方向就是不管是谷歌也好,还是微软也好,肯定会跟搜索引擎做结合。这块主要是用来提升搜索引擎的信息获取的效率b第二个大的方向,对于微软来说更加有优势,就是把类似于ChatGPT的这种技术跟办公软件做结合。因为跟办公软件做结合有一个好处,它可以提高日常生活工作的效率。比如说处理表格,或者写一写小作文,类似这种可以提高效率。而且可以很好的在工具软件的定位上,把一些资讯的敏感性过滤掉c如果只是单纯的跟搜索引擎结合的话,这里面可能会有一些政策、政治、意识形态,类似这方面的影响。而且从内容的提供信息给终端用户使用的角度来说,AIGC这种方式也存在一个被大家忽略掉的风险,以百度、谷歌来举例子,比如说传统的搜索引擎的提供商都是通过快照这种方式把信息抓取过来,实际上用户看到的是一个个的链接d用户点进去这些链接查看自己想要的信息,出了问题承担责任的话,其实是可以通过这个链接找到一个最终的责任方。即使像之前百度跟莆田系的关系一样,尽管可能口碑不好,但是我可以找到莆田系的医院承担最终的责任5但是目前以类似CHATGPT的技术,相当于对这些信息做了二次加工,这个责任的主体其实已经在这个过程中发生了变化。所以这时候其实如果大家没有意识到这一点的话,可能承担责任的话,谁提供这个信息,谁提供这个产品,就变成了最终的责任方。所以在具体的内容呈现上,可能还需要做一些优化投入成本方面,您指的是比如说需要买算力芯片、服务器芯片的成本,还是算法工程师上面的投入成本?1要做大模型的话,算法成本一共是包括三部分a第一,刚才已经提到的这部分,基础的算力投入,这块大概是三四百万美金到一千万美金左右的规模,无非是我投入的少,训练的时间长一些,比如说170天,200天,大概这样的i如果投入的多一些,像英伟达也在合作做大模型,五千亿的参数,我投入了3,072块A100做训练,这块效率可以缩短到20-30天ii这个成本在整个大模型训练过程中最少的。真正的大头在数据采集、模型的技术迭代和优化过程中。这一块需要堆集大量的研发人员、工程师、科学家做这方面的工作iii比如说数据采集,我们要抓取整个新浪、网易、搜狐、知乎这些网站的数据,因为这些网站都有反爬虫的策略,所以需要堆集大量的人员去写破解反抓取策略的策略,这块会耗费大量的人力和工程师的时间b第二,引入用户反馈机制,这时候不仅仅是研发人员了,有大量的标注人员,有大量的用户参与,这块耗费的一个是时间长,另外一个是成本高。对于OpenAI来说,每年在这块的投入在1亿到1.5亿左右美金的规模,这是比较大的地方。因为数据采集和处理的时间会远大于单纯训练的时间c第三,模型正式上线了,运维和部署。像ChatGPT一样,上线以后很快获得日活一亿左右的庞大的用户群体,这个过程中我要处理数以十万计,甚至数以百万计的请求。过程中需要堆集大量的服务器,需要做分布式部署,需要做负载均衡,甚至搭载网络安全策略,防止黑客攻击2这个过程中还会产生大量的比如说电力的消耗,这块每年的成本至少在五千万美金以上。所以主要由这么三大部分构成的您说到的这几块,是不是也要分训练相关的成本,以及运营过程中的三块的成本。这块会有什么差异吗?1比如说前两部分,我们都可以归纳为是训练的成本2第三部分可以归纳为服务正式部署上线之后运营方面的成本像国内的浪潮、海光,他们跟英伟达这块的高算力相关的芯片,或者是服务器能不能支撑上。如果说英伟达他们的芯片不能卖给中国的话,中国有没有类似的解决方案?1从两个方面说,单纯讲芯片和算力的研发能力这块,我们肯定跟英伟达这些公司是有差距的。不管您提到的浪潮、华为、寒武纪,哪怕研发出来最顶级的芯片,还是有比较大的差距,这是一块短期内应该还是比较难跟上的。即使我们在某些技术上有优势,但是最大的问题不是在单纯的技术上,而是在整个生态体系,这块英伟达非常完善2我们可以分享一些数据,比如说在全球的超算中心,英伟达大概可以有90%的份额,全球的云服务中心,那边可以有80%的份额,这个其实在短期内很难改变的状态3再从国内的这些不同类别的厂商,从采购高端显卡的实际情况来看,这种限制肯定会有影响,但是影响可能没有我们想象的这么大,可以说政策是政策,生意是生意。比如说目前我们国内的四大巨头,像字节、阿里、百度、腾讯这四家公司,在CHATGPT火之前,去年的这些数据每年大概采购A100这种级别的显卡的数量,大致是在2.5万片左右4像浪潮这些公司,英伟达那边提供了相当于稍微有点阉割的A100,或者H100同级别的显卡和芯片。基本上没有特别大的影响,至少目前来看像百度刚才您说到的一些,您觉得训练出来可能也差不多。从算法模型来说,因为ChatGPT3.5它是闭源了。像百度、字节他们未来研发出自己的GPT产品,从过去的3.0开源版本找这些数据,去直接拿它的模型在上面改,还是说需要重新去搭建一个大的模型,这个具体在算法上大概是怎么样去做?1这块目前比如说从字节那边了解到的情况,从阿里那边了解到的情况,基本上都是基于GPT3.0以前,就是开源那些东西拿过来去改,这个相当于是一个基础。当然GPT3.0的基础也是以预训练模拟训练作为最底层的算法逻辑的。所以从这个角度讲,你可以理解为大家在通用模型上是一套东西2尽管不会从0开始的这么一种状态,但是训练的时候OPENAI尽管细节我们没有办法复现,但是至少方向上是明确的。比如说过程中引入用户反馈机制,用户反馈机制说起来高大上,但是实际上就是堆人,可以简单的这么理解,针对同一个A,我组织成百上千的人去组织或者提问不同的Q,针对同一个Q,组织成百上千的人去回复不同的A3这个其实就是为了满足内容生成,就是预训练的时候我有大量的多样化丰富的数据,才能够满足AIGC这块基础训练的需要4其实目前百度文心这块欠缺的可能就是在这一点上,在内容的多样性上,丰富度上有差异。因为之前我们不要说国内的公司了,包括国外的公司,包括谷歌这边其实也是一样的,它的整个研发过程中,其实普通的用户很少参与,都是堆积大量的工程师、科学家、研究人员做这个工作,在正式公测之前普通用户很少参与5但是OPENAI经过前几个版本的迭代,在这个过程中发现了普通用户参与的好处,所以才推出了用户反馈机制,大家顺着这个思路做就好了。细节上可能没有完全复现,但是效果上不会有太大的差距在短期没有能够创造收益的情况下,您觉得这些互联网巨头可以持续做这个投入吗?年化下来费用大概总共是多少?1其实对于OPENAI推出CHATGPT来说,在整个的领域,我们现在已经可以看到很多的迹象,不管是前美团的合伙人王慧文总,他自筹资金,搭建团队研发模型,还是说从目前一些招聘渠道,可能对NLP、AIGC相关人才的需求,我们已经可以看到这些迹象,大家都会增加这方面的投入2之所以会增加这方面的投入,其实是因为OPENAI推出CHATGPT有点像一条鲶鱼,大家如果不跟上这波浪潮,有可能在未来会被甩掉,这是极有可能的。所以目前大家基于被动防御的策略,我们可以看到不管是谷歌也好,百度也好,阿里也好,这些公司都在宣布往里面投入资金做模型3所以相对比较短的时间内,因为还有后续的比如说GPT4这些东西不断的推出,所以在未来2-3年的时间里,在这种类似CHATGPT大模型的资本的输出,肯定是一个可以预见的一个地方如果放在中长期来看,最终的格局大概率国内就是一两个,两三个大模型最后能跑出来。现在可能有很多家去投,或者很多家已经有布局,最终要去做这个事情。您怎么看待这个事,终极来看的话?1如果终极来看的话,个人认为不管国内还是国外,一定会存在多家类似CHATGPT这种大模型。比如说国外谷歌和微软的关系,包括把苹果也拉进来,甚至特斯拉,我们举个简单的例子。这些巨头都有可能研发自己的模型,而且他们所处的生态位或者产业略有差异2比如说像苹果,它有大量的智能终端,把这个能力,或者自己研究大数据的模型跟SIRI做结合。它通过智能设备,比如说打开谷歌的应用,或者打开浏览器去做搜索,会更加的直接,有更高的效率3再比如说像谷歌和微软,虽然短期内比如说微软借着这个风头,看起来具有领先的优势,它在短期内也的确可以影响到互联网、金融、投资、科技、人工智能相对比较精英的人士a比如说从日常习惯使用谷歌,转移到使用Bing上,但是它无法改变更大的格局b这个格局比如说像谷歌全球的市占率大概在90%还要多一些,Bing大概只有3%-4%之间,因为这些应用嵌入到很多硬件设备当中的,比如说电脑,甚至更多的属于中低端的智能手机设备,所以很难短期内有非常大的市场渗透率4所以真正决定胜负关键的不是一时的得失,而是参与的玩家所处的生态位,这个生态位决定他可以快速的把这种能力推给他的用户,达到非常高的市占率如果我们分技术和应用来看,先说技术这个层面,微软做的这个东西,OpenAI做的这个东西和谷歌现在做的东西,从技术层面会有很大的差异吗?还是更多是应用场景的差异,大家所拥有的数据资源的差异导致最终的应用效果的差异?1其实单纯从大模型上看,本质上没有特别大的差异,因为现在三大系列的模型,不管GPT,还是BARD,还是XONES(音),都是基于预训练和TRANSFORM这两种基础,都是谷歌大概在2017年开源的TRANSFORM那一套基础之上做的a只不过大家以前有一个创新者困境,而且这些年人工智能除了很久之前的AlphaGo能够让大家感觉到很兴奋以外,在整个过程中一直没有让人感觉特别兴奋的一个点b所以创新者困境不仅困住了国内和国外巨头的手脚,首先资本上大家不敢过分的往这里投入,谁也不知道我投入5年、10年、8年到底能不能做出来2再有一个在团队内部,一个团队负责人工智能的项目,稍微时间长一点,比如说两年,甚至有的短到半年,如果见不到效益,或者没有好的一些东西,这个部门可能就被裁掉了,这个团队也被裁掉了,这跟创新者困境有很大的关系a现在OpenAI把这个东西推出来以后,因为这么多研究大模型的厂商,之前使用的算法、基础、原理、机制这些基本都是一致的,只不过他们之前可能没有采用像OpenAI采用的用户反馈机制b当然有一些细节上的调整,这个肯定没有完全的一致。但是这个用户反馈机制在这里面会非常重要,可能从量变引起质变的效应3现在大家是创新者困境被破除了,而且OPENAI也给众多的厂商指明了一个方向,你引入这个机制,让更多的用户去参与。相信这些巨头应该在相对比较短的时间内,会陆续推出自己类似CHATGPT这种产品出来ChatGPT其实是基于GPT的应用,从后面GPT这一套,大模型的这套东西来说,应该各家是原理上基本上是类似的,能力上也不会有太大的差异,更多的是涉及的领域,手里的数据资源等等这些方面。往后看这些东西有没有可能被开源化,类似于像数据湖等等的技术开源化,或者像安卓那样?1这种开源的模型也有,比如说像法国的BIGSCIENCE推出的BLUM,可能有很多从谷歌、微软,甚至还有OPENAI这些公司出来的,他们推出一个开源的框架,也是一个类似于CHATGPT的,只是效果怎么样,现在大家没有真正的去做深入的体验。但是这种开源框架是有的2考虑到一些实际的情况,特别是跟行业应用做结合,比如说在金融科技领域,在数字政务领域,或者在教育、医疗等等这些实际应用领域的话,单纯的比如说一个模型公司,它能够获取的数据都是基于公开网络上获取的一些数据3那么像我们刚才说的这些领域的数据,基本上是不对外公开开放的,还是有人需要在这些算法模型基础之上,拿过来做二次的处理,去往垂直领域做相关模型的进一步研发如果从技术层面,比如微软和谷歌两个技术层面是类似的,相对他们的不一样更多的体现在他们拥有数据不一样,用户反馈的机制不一样,从而导致使用效果不一样,是可以这么理解吗?1其实跟他原有的产品结合上。比如说微软靠BING还是很难挑战谷歌,但是它有OFFICE这套软件系统,有WINDOWS操作系统,把这些能力跟自己原有的优势做结合。比如说像谷歌,我可以跟安卓系统,可以跟搜索引擎做结合,这些方向上会更强势2其实可能在这不同的生态位上,每个公司可能会有自己独特的优势。比如说像苹果完全可以跟SIRI结合,直接跟终端硬件绑定了。特斯拉也一样,特斯拉跟OPENAI有这种投资人的关系,但是OPENAI肯定也是没有办法直接获取特斯拉在智能驾驶上的这些数据的,要么以把SDK或者API授权给特斯拉使用,要不特斯拉自己干了。所以基本上是这样的您刚才说在一些细分领域,比如政务、金融这些领域,这些可能是某种程度上属于GPT这套,大模型最容易去落地的,比较容易落地的几个场景。如果从落地的难易度的角度,您觉得哪些领域会比较快?1在落地领域,最快可能还是在工具软件上。因为我们刚才提到了,类似CHATGPT这个技术有一个很容易被大家忽略的风险点,就是AIGC的过程a当然我们在前几天,比如说新Bing的体验上已经可以看到,比如说它去分析GAP的行情是上涨,但是实际上是下跌的,其实问题恰恰出在这b这里面有信息的二次加工问题,尽管你提供了信息源,但是我们看它有足够的理性,有足够的分辨能力可以甄别这些信息。但是对于绝大多数普通用户来说不具备这些分析能力,也没有这样的理性,也不愿意分辨。这个时候出现问题直接承担责任的就是信息的提供方。所以具体的交互形态上,我们可以得出这么一条结论i第一,不是所有的内容适合AIGC,就像我们谈到的金融科技、数字政务、教育、医疗,很多就是1,2就是2,AIGC需要划定一个范围ii第二,细节的算法需要做一些优化。现在有的人在不管是调侃也好,或者别有用心也好,可以对ChatGPT回答的内容做诱导,这个也存在问题2当然,在具体的内容上多少存在偏意识形态或者这些方面的问题,这个可能会更加的危险。所以大家可能在去用这个技术的时候,刚才说的由于内容的真实性和可靠性这块引发的一些小的问题,看起来很小的问题,需要先解决掉。然后才是跟商业做深度应用的结合3再把这种技术跟行业深度应用的时候,其实有一个最后一公里的问题需要解决,主要在多模态交互上,我们知道在CHATGPT,我们跟它交流的时候使用的输入文本的方式a但是真正在高速上比如说开车,或者在银行网点办理业务,这些场景基本上用户跟这些智能机或者AI去交流的时候,基本上采用语音交互的方式为主,不可能说我还要去提供一个键盘输入文本,几乎不存在这样一种情况b所以我们可能目前像阿里、百度,也包括微软这些公司提供的智能语音的这些产品,90%的识别准确率没办法满足线下对答如流,答非所问这种实际应用的要求,这些基本上可以理解为最后一公里的要求,得先把这些问题解决了,才能更多的跟行业应用做更深度的结合除了刚才说的这种大的,像微软、谷歌本来就有大的软件,或者大量的流量入口,比如说像谷歌搜索,或者office,在一些垂直领域,类似于刚才说的金融、政务,小公司比大模型不用比了,完全不是一个量级。最终这些垂直领域的公司,是不是大部分会演变成使用巨头的模型来做行业应用的应用型的公司?1对,相当于巨头们更多做的基建的产品,他们提供基础的能力。行业里面还是有初创团队,或者中小公司,他们做处理技术应用的这些问题。而且技术应用这块对于大厂来说,他们觉得这些属于苦活,累活,也不愿意去干这些东西2但是这里面也存在一个巨大的机会,我们刚才已经提到了,多模态交互是一个非常复杂的,比如说我们在银行网点,开车的时候,它的环境,极度嘈杂,车内存在多个人a这时候我们说话的话,AI需要自主的分辨出来跟谁说话,或者这些人说话是不是要听,要不要做出回应等等,它是非常复杂的东西b这里面就像当初上世纪70-80年代的时候,微软和苹果抄袭施乐的界面,有了现在以键盘、鼠标、触控为代表的操作界面一样,谁在服务的过程中把交互的部分冲击出来,ChatGPT作为核心,实际上就是下一代的操作系统3我们知道操作系统像谷歌、微软、苹果,三家公司的市值大概7万亿美金左右,这个想象力空间是足够的a再有偏一些智能设备的助手方向的,比如说像苹果的Siri,小米的小爱同学等等,类似这些产品也会有这样的机会,比如把这种能力跟自己的语音助手做结合,未来一旦做好了,也不排除分拆独立的可能性,成长为更好的,更有价值的产品。因为现在ChatGPT回答我们任何人的时候,你可以理解为它就是一个ChatGPTb但是未来它完全可以更加的以个性化,比如说你聊的时候,它可能像成龙,我聊的时候可能像肖战,带有比较鲜明的人设特征的,可以满足用户的个性化方面的一些需求从相对中长期来看,一方面有大模型的大厂,以及掌握大的流量入口的大厂,不管搜索引擎还是offic,具有丰富的用户群体直接受益了。另外一块比如说掌握语音技术的,掌握跟人交流技术的,相当于把后面大模型更好的跟人机交流搭起桥梁的。其他方面您觉得还有一些什么样的方向,或者说细分领域可能会受益于这个浪潮?1这块其实主要看好五个大的方向2第一,做基础算法的。就是OPENAI、百度文心,谷歌的BARD等等,有一堆算法的。但是他们的商业模式相对比较简单,一种面向企业和开发者提供的标准的SDK和APIa再有我在这个基础上把它稍微功能化处理一下,变成有点像功能软件,比如说处理表格用来写小作文类似这种功能,以订阅的方式向终端用户提供b但是这两种商业模式的附加值不够高,这是基础,而且研发成本又投入大,这是第一类方向可能会存在的一个困境3第二,提供基础算力和应用服务部署这方面的,主要是有这么三类公司,一类是像英伟达、寒武纪这种做基础芯片、显卡的公司a第二类像华为云、阿里云、百度智能云这种提供云服务的公司。第三类因为我们已经看到了GPT4要推出的时候会增强这种多向模态的能力,现在ChatGPT更多的处理文本,文本对算力的要求更少b未来我要增强音视频、度片类似这方面的处理,会要求更高的算力,还会有一堆专门处理音视频处理,或者图片处理的,提供这些算力支持的公司,比如说有一些新型的,像平行云类似于这些,但是都提供基础的算力支撑,包括服务部署方面的公司4第三,刚才已经提到了,主要是技术应用。比如说跟搜索引擎的结合,跟操作系统的结合,跟个人助手的结合,跟工具软件的结合,或者是我就是干脆直接的垂直行业的应用,比如说进入科技领域,比如说像海康威视,它有渠道和客户资源,我把原有的能力跟硬件产品做结合,它也能够在这里面获得足够的成长和机会。相当于渠道和客户在这里面也会非常关键的5第四,刚才讲了软的东西,讲了算法,这些东西我要拿过来给终端的用户做交互的话,我都会依赖一个载体。比如说智能手机,可能是一台智能汽车,也可能在未来甚至眼角膜植入芯片,可能满足用户交互的东西。所以相当于在物联网终端这块,跟CHATGPT这种技术做结合,也是有很大的机会的6第五,在AIGC这样一个方向上。因为有了软件,有了硬件,用户跟软硬件结合在一起的智慧体系交互的时候,需要大量的内容。单纯靠人工生产的效率太低了,所以使用AIGC的技术,生产比如说不管是文本、图片、音视频内容的提供方,在这个过程中也会有足够的机会您的公司应该也是做类似于终端这块的是吧?1我们在过去的几年时间里面,主要是给银行和政府提供服务,把刚才说的这些技术,比如说智能语音、NLP,甚至还有数字人的这些软硬件结合在一起,解决一些无接触产品和服务的东西,软硬件结合在一起的a比如说以金融行业的银行业举例,有一个巨大的需求,我们知道传统的银行行业是人力资产密集型的,因为疫情的影响也好,或者现在技术进步的影响也好b现在中老年人可能不方便去,年轻人不爱去,这种柜台业务极度萎缩,所以银行面临着巨大的降本增效的压力。2要解决这个问题无非就是两条路径可以走a第一,对现有的银行网点进行升级改造,提升智能化、数字化的水平。所以这里面可能会部署一套软件,外加上配套的,比如说一个网点部署5-10台左右的硬件。原来一个网点要雇20个人,现在只要雇两个人就可以了,这是一个方向b再有这个网点实在运营成本太高,需要把它裁撤掉,这个柜台业务尽管少还是要有,需要应对这种需求的变化。那怎么办?可能有点类似无人超市的产品,一台售价70-80万人民币,原来的网点可以覆盖20-30个小区,这种设备前置部署到小区,从总的成本投入上要员大于网点运营的,但是可以增加便捷性c以前我要驾车或者乘坐公共交通工具去网点柜台办理业务,现在下楼可能就能办理了。这种技术在ChatGPT的加持下有可能取得大的突破。我们知道全国银行网点有22万个,这个规模是足够的您说的软硬一体的表现形式是什么?是类似于我们平时接触的ATM吗?是一个机器还是什么?它可能和我们平时接触的ATM机器有什么不一样?能处理非现场业务还是什么?具体的形式是什么样的?1比如说跟ATM这种机具结合在一起,也会有屏幕,就是当你在办理业务的时候,遇到问题的时候,会有一个数字人代表的AI,通过语音对话的方式直接跟用户交流,这样就不需要在大堂部署客户经理了,相当于这么一种做法2这块从2019年末,2020年初就开始做这些事情了比如说在中行网点,在浙江省银行,在很多地方开始部署了在政务领域呢?能类似的举一个例子吗?因为大家对应用场景没有一个感性的认知。1在政务领域其实跟我们给银行提供服务是类似的,比如说党建,一个村党支部,或者我智慧社区,我一个社区的办公室,可能也是类似于银行网点部署,它也是软硬件结合在一起去做,只不过从收费模式上略有差距。但是相比较提供基础的模型,它是一个高附加值的,因为软件就是按软件授权,硬件就是按照肯定会做足够的毛利空间,目前大概是40%左右2软件因为不同的行业,其实它只是在内容差异,比如说我把银行的数据拿过来,我训练大概有6-12个小时,训练完了就可以部署了,同样一套软件,把这个东西拿过来,把政务的数据拿过来也是训练类似这么长的时间就可以处理了a我是说单纯从交互层面上,在不同的行业差异只在一些不同的RPA流程,比如说在银行是办卡,跟柜台业务有关的东西,数字政务更多的是跟政策,跟民生服务相关的,智能流程自动化模块的接入会有差异化,会有一些不同的地方b但是未来这个方向可以通过类似开放平台的方式去做处理您现在用的是一套自己的模型和算法,数据是属于银行的,拿到他们的场景里用他们的数据训练,实现一个最终能够对话,或者能够解答问题的效果?如果百度推出这个,或者国内基于中文体系推出这个的情况下,从您自己发展的规划来说,您准备自研一套呢,还是接入到大厂里面去?1对。单从我们自己来说,我们这个过程中一直和商汤、百度、阿里、腾讯这种级别的公司存在比较直接的竞争关系,所以我们在这个过程中肯定用自己的2但是我们和他相比我们的优势在什么地方a我们的优势可能不是在于基础模型的研发,我们在解决最后一公里的问题。比如说一个智能机具,前面你和我,我们两个人都站在智能机具面前,它处于唤醒状态的时候,咱们两个人同时说话,这个时候它需要判断出来需要跟谁去交互,或者咱们俩说的话它是否需要做出回应,它必须得具备这种能力b这种工作对于大厂来说,它没有下沉到这么深的地方去专门干这些事情,它也认为这些成本对于他们来说,或者收益对于他们来说,完全不成正本的,他们看不上这块的东西背后的大模型,有些开源的技术可以去采用是吧?站在巨人的肩膀上,不用从头研发的?1是这样的,但是你获得的数去有独特的优势2比如说单纯的语音识别上来说,比如说迅飞做语音识别最好的,但是你把AFR这个功能放到网点上发现出错的几率太高了所以还是需要专门针对这块做大量的纠错算法的处理,推理的一些处理,还需要做大量的训练3这就是小的创业团队也好,或者专门做这块服务的企业也好,他可能在这块具有优势一方面利用已有的开源的,或者框架性的东西,不用从最底层开始做,在某些方面可以深耕是吧?如果软硬一体的话整个毛利率做到40%以上。如果是软件的话,相当于把软件加到现有的机具里面去,可能是更高毛利的收益的?其他的交付还需要什么?除了硬件采购的成本之外,还有别的成本吗?比如说现场安装配制这些?1是这样的,硬件大概是40%-45%2软件这块可以做到70%以上,大概这样的,那些成本都包含在内ChatGPT发展路径和竞争力2/15ChatGPT算力、研发、进展情况1初始是谷歌做的TRANSFORMER,CHATGPT一代就有40几亿个参数。参数可以理解为深度学习的时候讲到的神经网络,一层有1,000个节点,节点互联,是1兆个参数。CHATGPT是1,750亿个参数。我们实验中做过的最大的模型是10亿个参数,所以大概是我们的175倍2TRANSFORMER核心就是用大量的语料进行训练,做出理解力很强的AI。语言理解力是我们长期攻克的难题,中文是最难的,首先要做断句分词、根据上下文研究语法模型。但从TRANSFORMER开始,不需要做断句分词,所有都从语料库来,实现理解。统一了所有语言的学习方法3OPENAI从1代到3代,模型不断放大,从43亿到1,750亿。网络复杂度是几何级数的增加,我们估算是2-3次方之间4不能光看参数大小,参数很多,但是节点互联很简单也没有意义。算力投入一方面是规模,另一方面是迭代次数和时间5CHATGPT此次是用了5,000块A100,每块节点是8块A100全互联。美国对我们禁运的首先就是A100。用NVLINK进行互传。如果不用NVLINK的话只能用CPU,传输时间会变长。国内不会很快追上OPENAI的算力投入6截止到2021年底:因为新知识可能会产生矛盾,出现之后需要人为处理。知识还需要进行重新校验的,所以不能接入在线数据中国的ChatGPT有哪些瓶颈1从处理器的角度,我们有很多可以支持计算的处理器,例如海光、飞腾、寒武纪等。最大的问题是做不了高制成,只能做到28NM,28NM会导致芯片密度低,能耗更高。导致NVIDIA一块卡我们要用2-3块2第二个问题是互联,有一些机器的互联可以,例如飞腾等,但是有产能问题。缺乏NVLINK的互联设备,我们在做大语言模型的时候问题就很大3海光有不到3,000块的A1004CHATGPT能够做到99.9几的理解能力,我们如果降低要求到97-98之间,阿里京东百度等自身的算力就可以在1-1.5年内做到这个水平。短时间追上OPENAI是很困难的。微软的投入不光是钱,更多是云计算的基础设施,例如5,000块的A100,按照市价,算力投入在3,000万。但如果降低要求,现在相关领域做应用的话还是有机会的5瓶颈最主要的还是在数据交换上,如果互联不好的话,5,000块卡和100块卡的效果是一样的商业应用价值1国外很快就会淘汰数据程序员,可能会淘汰一半,交一部分的工作给CHATGPT2国内程序员供应量多,如果用CHATGPT取代反而成本会更多。但另一方面,国内有些行业,例如3D建模的人才,我们目前是缺乏的,3D建模本身门槛不高,但没有办法跟机器比速度。CG图片、特效成本可能会迅速降低3另一个就是销售客服。现在很多地方都是机器客服为主,国内做外贸的很多公司都需要英语销售客服,但他们跟外商的交流很不畅通,如果换成CHATGPT,可以看到工厂的实时库存、帮助下订单。CHATGPT计费标准来说,这样的替代也是很便宜的中美竞争1如果看大模型的话,中美的差距有可能会拉大。AI模型、芯片产业链都需要投入2如果降低NLP的理解能力,不影响后续工作的话,也是一个方向数据分工1国内主要问题在于复制性的内容太多,国外相对而言能够找到一些权威的语料。这是中文和英语的最大差别。权威就是可以告诉机器,从NATURESCIENCE上面找到的文章,权威值就是99%,我们在万方知网上面能够找到的权威数据有限,这些论文发了中文也都会发英文,我们是比较吃亏的。中文语料训练上没有问题,但是在知识质量上我们会低一些2微软数据标注团队质量很高,我们的劣势:有劣势但是不大。人工标注的话不会具体到每一篇文章,只会是标注刊物、高引的文章等。例如知乎的高赞文章是不是高质量的需要人为来进行鉴定确权的问题1CHATGPT的创作思路跟我们所说的洗稿很像,据说OPENAI会给以后生成的文章里面打技术性水印2少数作者会启动防止被引用的开关,大部分作者不会启动3NEWBING会生成来源4175G的参数需要1T的内存才可以运行,开源是不太可能的审核1现在是基于关键字和简单语义识别2但如果变成80%的CHATGPT水平,发出违规文字的可能性就没有了公司竞争力1做类似CHATGPT需要几个元素a语料:自有平台或者爬取网页。微信有公众号朋友圈,百度是爬取,京东是产品和用户咨询评价,相对比较少。360和腾讯有搜索引擎,应该还在爬取。自有平台大一点就是知乎、腾讯、网络小说、门户网站等b算力:一个是看自有平台的CPU和GPU,现在比较强的是阿里腾讯,都有GPU的云。地方的数据超算中心都有一定的算力资源c钱:OpenAI拿到了很多投资d人2京东淘宝可能需要的是智能客服。百度可能需要的是自动驾驶和AI的联动。腾讯可能就是游戏的开发搜索成本1谷歌的首次搜索的成本高,但是重复搜索的单次成本不高。谷歌主要成本是不断爬取数据的成本2如果放到搜索引擎上,直接的问题就是广告放在哪里3搜索引擎市占率低的公司可以通过CHATGPT来抢市场,但是市占率高的公司如果运用的话会把最赚钱的广告业务挤掉AI方向1国内可能会在3D建模、网络小说方面发展2下游的游戏影视也会有变化ChatGPT技术壁垒和国产替代2/5核心观点1CHATGPT和以前GPT大模型的区别:CHATGPT是基于GPT3.5的基础模型框架,核心变化在于通过真实的调用数据以及人类反馈的强化学习进行训练2国内企业与CHATGPT的差距:百度、华为等头部厂商都有大模型,百度文心模型参数量已经达到2,600亿,从技术能力上国内相比专家判断比CHATGPT约晚1-2年3OPENAI第一梯队,GOOGLE第二梯队,百度第三梯队。从数据、算力、模型的维度上,主要是差在模型环节,包括清洗、标注、模型结构设计、训练推理的技术积累训练成本昂贵1GPT3.0离线训练成本高达1,200万美元,大模型重新训练成本达400万美元,都是租用微软的计算资源,成本与训练数据量成比例,增加GPU也可提升训练速度,中小厂商或将无法承担高昂的大模型自研成本2模型训练所依赖的高性能芯片被美国卡脖子的解决方案:采用国内自研GPU;用分布式CPU替代,部分大厂应用采用分布式CPU的方式进行训练未来商业模式1OPENAI或将对外输出模型能力,国内百度等企业也会跟进2国内应用软件企业未来可能采用OPENAI或百度等厂商的AI模型作为基础能力。专家发言1首先介绍一下CHATGPT,CHATGPT去年出来后,在全球AI界、创投界掀起热烈的讨论潮。很多人想了解CHATGPT具体是做什么的,我们可以理解为通用的问答系统,发布方是OPENAI公司,OPENAI是业内比较知名的人工智能研究机构2CHATGPT模型从18年开始迭代为GPT1,到19年有GPT2,到20年有GPT3等等,通过一系列的模型迭代,在今年推出了CHATGPT。这个模型是基于GPT3的模型框架3GPT3的参数量级非常大,有1,700多亿,所以这个模型出来后效果比较好,大家体验下来发现功能强大,在业界受欢迎。ChatGPT模型关键的能力来自于三个方面1前身是INSTRUCTGPT,通过真实的调用数据以及反馈学习,CHATGPT在模型结构、学习方式和INSTRUCTGPT基本上是完全一样的,INSTRUCTGPT基于GPT3.5的强大能力,整个模型通过OPENAI一个系列的迭代,有很多技术积累2CHATGPT主要的3个学习阶段包括,从OPENAI调用数据集中采取AI训练编写答案,第一阶段通过监督学习方法训练GPT3版本,然后用比较型的数据训练一个REWARD模型,用到一些对比学习和REWARDMODEL,第三阶段是强化学习里面的PPO算法和奖励模型的语言生成策略3跟之前的很多模型比,单纯用监督学习或无监督学习以及强化学习的端到端形式,现在分成多阶段来做,整体模型的训练开销非常大,这个模型有1,700亿参数,训练一次要400多万美元的成本,对资源的使用比较大分享一下国内头部玩家,比如百度、阿里、腾讯、字节、讯飞、商汤等目前AI大模型的参数量,以及与ChatGPT的差距在哪里?我们用多久能追上?1国内这样的大模型非常多,百度、华为都有大模型。百度文心模型参数量已经达到2,600亿,不逊于GPT3.0。百度今年宣称3.4月份推出类似于CHATGPT的模型2可能首期的应用场景会跟搜索结合,会形成CHATGPT、搜索的双引擎结合模式,会发布DEMO出来,整体看,模型的参数量级比GPT3.0大了50%我们国内的发展水平是不是和ChatGPT达到同等程度?1这个地方可以看一下OPENAI发展的技术史,动态看18年后一到两年时间国内的技术追赶比较快,提出比较好的改进模型,但真正的差距拉开是20年中,也就是GPT3.0出来后2当时可能很多人觉得GPT3.0不仅是技术,体现了AI模型的发展新理念,这个时候我们跟OPENAI的差距拉得比较远,因为OPENAI对这一块有技术的独到见解,也领先了国外的GOOGLE,大概GOOGLE比OPENAI差了半年到一年的时间,国内差了两年的时间3所以梯队上,OPENAI排第一梯队,GOOGLE排第二梯队,百度排第三梯队,差距不是那么大。动态看事情的发展,百度还是有机会做得更好4从百度发布的模型看,内测版还没有开放出来,我们体验下来发现效果不错,模型参数量级看上去和GPT3.0是不差的,所以目前看上去我们相对比较有期待国内主要厂商1比如字节跳动也在做大模型,一方面是应用场景,接下来可能有一些商业化。这个模型不是一两个月就能做出来,需要时间积累,随着后面AIGC、CHATGPT的深度发展,里面会形成越来越多的商业化内容,对于头部公司来说,做前沿的技术积累,有利于形成先发优势2所以像字节跳动、阿里都在往这方面做。阿里、腾讯不会复制CHATGPT模式,而是做一些与AIGC相关的产业化3阿里现在往智能客服系统、AI+营销做,使得商品介绍、广告介绍不需要人工生成文案,而是通过AI生成内容。头条也用AI生成内容,因为头条是以内容生产、分发为主要业务的公司4总结看我们跟国外的区别是,模型大小上我们很多公司可以媲美,从技术角度或者PAPER角度,可能我们跟他们的差距可能有一到两年的距离OpenAIGPT3.02020年推出,现在推出了ChatGPT之后市场大火。ChatGPT相对于GPT3.0有什么实质性的改变,造成市场认可度高?热度会不会突然下去?1现在CHATGPT做了会话机器人,不是IT圈子里面的人也可能去试用,使得人群受众变广,其实基本的模型、训练方式,两者之间没有多大区别,而是在GPT3.0基础上做了特定领域的数据,拿过来做训练得到特定领域的模型。所以总结下来不是之前的GPT3.0做得不好a现在比较热,热度会不会过两个月下去?坦率说,从我的认知来讲,短暂时间内热度不会下去。从业界很多企业对这个事情的反馈来看,比如Google、百度相继在发力bGoogle已经列为红色预警,包括将来对搜索引擎的颠覆,有很高的优先级;百度也是因为搜索引擎,对这块非常上心,3月份会推出新的模型,到时候看市场的效果c所以从大公司的反应来看,这个事情可能不是噱头,而是新的技术革命的发展。甚至有夸张的说法,业内一些专家认为这是PC互联网之后的又一个里程碑式的发展。包括我们自己体验下来,ChatGPT的功能确实是很智能2而且随着OPENAI的研发,接下里朝着AGI方向的发展的更大规模的模型,我们有理由期待这个事情不是一波流的,而是从现在开始持续形成大的影响,并且扩散出去从数据、算法到算力,国内有没有可能做出ChatGPT这种有商业化价值的模型?听到一种说法,国内号称模型参数高,但效果特别差?我们中国独特的市场有没有办法培育出比较好的产品出来?1从GPT模型的PIPELINE来看,有数据、算力、模型。数据上,国内是不缺的,百度、今日头条有大量用户的真实场景的数据。算力角度,一些大厂比如百度的文心模型达到2,000多亿参数量,虽然训练成本非常高,但大公司承担得起2我们真正缺乏的是技术积累,包括数据怎么做清洗、标注以及模型的结构设计,怎么做训练、推理,这个地方很多都是需要经验和积累。包括里面的很多算法是OPENAI和DEEPMIND提出来的,作为原作者的理解能力是我们远不及的320年GPT3.0出现的时候,我们跟国外的差距就拉大了,当时很少人觉察到GPT3.0不仅是一项技术,那个时候我们开始逐步落后,坦率讲国内这块技术方面落后于国外,而数据、算力不会存在瓶颈4总结下问题,我们跟OPENAI的距离确实存在,重点的技术瓶颈可能在这块的模型上面,这也是国内的弱点5所以我们需要投入更多的人力、资源逐渐弥补上,百度投入也非常多,按照这种速度下去,也许不用花两年的时间,我们能追上步伐大模型为什么会产生?百度文心模型为什么不如ChatGPT?1涉及到模型参数的量级,以及数据的量级。比方说算力提升10倍,那么把模型参数做更大,或用更多数据来训练2如果我们单变量来看这个事情,数据变大,模型效果变好,或者单纯把模型参数变多,模型效果也更好。如果算力提升10倍,这两个怎么平衡?光把模型参数变大,不一定会效果好a数据集的质量也要有保证。单纯的模型大小不足以刻画模型效果,还跟数据集的大小、质量有关。第二点,模型之间存在差异b百度、OpenAI模型的本身结构不一样,参数量大不代表模型效果好,因为不一定学到通用能力。百度没有公布模型的细节,我们不太了解是怎么做的,而单纯通过参数量级比较,不大能够看出效果的差别c百度对这块细节公布不多,数据集大小、模型的框架结构没有特别公布,所以不大了解整体模型的效果,以及跟OpenAI技术的差距有多大,我们只是单纯从参数量大小判断,不太好判断3我们很好奇一件事情,比如一个模型学了很多东西,东西学到哪里去了?这也是一个问题。大家可能会去想,那么通用的东西存到哪里去了4这一块目前做研究的同行非常多。目前一个主流观点是模型主体结构用TRANSFORMER结构,更多做一些知识的存储,包括可能涉及到KEYVALUE的形式,涉及到知识检索的能力,但里面的细节就需要比较多的时间来解释OpenAI大模型今后是否提供给个人或机构使用?国产办公软件底层的人工智能,会不会用微软OpenAI微软产品中各种场景都会接入1其中2B的业务比较有影响,比如订阅OFFICE软件的企业的员工可以享受智能化服务。国内软件目前没有这个功能,为了面对微软的竞争,未来都会往这个方向发展2国内其他公司如百度也会通过输入AI能力来进行2B的商业化布局,所以对国内的企业来说也可能会有很多选择,可以选择接入OPENAI或者GOOGLE海外公司,也可以接入百度等国内公司提供的AI模型3市场竞争看模型的整体效果和价格。此外也涉及法律法规的问题,目前AI底层能力的使用这方面还没有特别的限制,还是法律盲区,未来是否能够顺利引入微软OPENAI的算法模型,还要有待未来立法的规范4但是AI模型未来接入应用场景是大势所趋,具体接入产品看情况AI是否会大幅降低人工,未来AI为底层生态之后,之后在传统软件的参与者会减少?国内大模型做的更好之后,小模型的企业存在的必要性还有吗?1有些行业的工作人员确实有可能被替代,内容生产的,AIGC的占比会大幅提升,挤占投稿的量级,AI也帮助提高了生产力,帮助投稿的质量和效率提升2NLP领域的会存在这样趋势,小模型的厂商会慢慢被竞争掉,中小厂商没有办法去创造大模型,接入2B的服务,没有办法自研,这种模式在将来会存在训练中采用的硬件设施通过买或者租的形式,每次训练迭代成本怎么计算?买和租各要多少钱?国内那种方式做大模型比较多?1GPT3.0涉及1,700亿参数,内存达300+GB,训练过程耗费1,200+万美金,此外离线训练后,访问请求来来的线上服务也需要开销2基础设施都是微软的计算系统进行,没有自建。训练过程中会出现BUG,但是都没有敢重新训练这个模型,因为成本太高了,所以没有做及时的修补,披露出的数据是重新训练一次要400+万美金据说ChatGPT是40个人员做强化学习,为什么能在人员投入这么少的情况下,在GPT3上做出ChatGPT?核心能力是什么?1CHATGPT跟GPT3的主要区别,额外FINETUNE增加了训练的数据集,增加了通过人工标注的样本,所以40个人是不准确,实际上还有大量标注的团队,40个人可能只是用来判断回答是否符合标准2从算法的角度来说,GPT3.0和CHATGPT在模型上没有太大区别,只是加了专属领域的数据集进行训练替换人工的问题,传闻数字媒体已经被替代了,实际情况如何?GPT3.0专注于专业领域,是否比ChatGPT更快一些?1AIGC各家都开始鼓吹并开始投入,到2023为止,网络内容20%通过AIGC生成的,网络编辑是很容易替代的,比如摘要、新闻等2头条这边也在逐步用AI生成投稿,这块趋势是通过AI生成内容会逐步增加,机构预测2025年AIGC内容占比达30%+,量级很大,增长也很快,能够帮助大幅提高生产力和其他AI模型相比,对GPU的需求区别?1GPT3.0对GPU算力要求很大,训练过程采用400+个GPU。未来对GPU需求越来越大,价格变得贵+产业链供应能否跟上需求是重要的限制条件2这也导致创业公司会更难做相关的事情,可能更多集中在大厂做这些事情ChatGPT训练数据截止到2021,但是对话内容也可以涉及最新的信息,怎么结合在一起?1模型具有泛化能力,模型可以做到这一块,通过历史数据训练,不可避免有时间限制,2023年的问题可能在模型里面找不见,但是其他字段能够在模型找到联系,模型可以实现预测2同时也跟数据分布有关,历史数据的函数关系,已经能够刻画绝大部分关系了,用新的数据训练,可能也会有类似的分布训练的频次怎么界定,是否要每隔一段时间后更新数据集,对大模型重新训练?1比较快的是用FINETUNE的形式,但是引入新的数据集可能会导致灾难性的遗忘问题,这就是LM模型的难点问题,也是主流的研究方向2我们也可以累计到一定程度进行重新训练,但是这样成本高,未来LM模型的训练方式也是会持续优化,如何不断加入新的训练数据,同时又不导致原有模型性能下降ChatGPT训练依赖高性能的芯片,中美竞争情况下,被卡脖子的情况?1大模型依赖GPU的芯片,如果对GPU芯片封锁,会有比较大影响,解决方式是有国内自研的芯片,二是我们大量用GPU进行训练,供应能力跟不上需求2也可以用分布式的CPU进行替代,会慢一些,字节这边是分布式的CPU用的比较多,包括主流的搜索推荐等需求模型训练+租金是1,200万美元,离线训练的阶段需要多长时间?1依赖于GPU的投入量,从而加快训练速度,之前提到中美在这个领域的差距有一年半到两年是指达到整体的效果所需要的时间2实际人员整体投入应该很大,OPENAI光论文中研究人员都有30多人,还有大量的工程师等,百度这边投入也有200-300人。新增数据训练的费用,要看增加的训练数据的量级,费用和数据量是成比例的首选百度还是bing?预测哪个效果更好?1不太好判断2需要产品发布后比较未来两年的角度,中美AI领域的差距是否会因为GPU芯片禁运等原因差距拉大?1GPT4.0今年会发布2性能会有进一步提升,差距拉大是有可能的ChatGPT类的模型是否对知乎这种内容平台起到更大的作用?1知乎本身就是问答系统,问题的回答有可能通过CHATGPT来实现2甚至比人工效果更好,包括程序DEBUG的角度也可以朝着自动化靠拢只有大的平台能做大模型,知乎能自己研发吗?1涉及到商业模式的问题,知乎这类的企业可能不需要自己研发2未来可能百度等头部厂商会对外开放这种能力,其他企业直接采购使用就可以投资人谈ChatGPT2/10技术突破有望构建新的商业模式1对于投资行业来说,AI并不是一个全新的领域,大家持续关注也有近十年的时间了a从2012年左右深度视觉模型带来CV(计算机视觉)的快速发展开始,到2016年前AlphaGo给行业带来的震动,到这次OpenAI的大模型ChatGPT引起广泛的触动,底层逻辑是大模型的性能带来的质变提升,从而衍生带来新的垂直场景解决方案的构建,以及新商业模式塑造的可能性b一直以来,AI领域较多的解决方案是,通过端到端垂类应用,用小模型优化算法和模型精度,以降低算力去解决垂类场景问题,但如今这一商业思路受到了较大冲击。因为在过去的路径下,行业内的公司大多重复研发功能相近的产品或模型,让AI只能在一些有限的场景内,较多是toB领域去解决问题,壁垒不太深c现在,大家开始对大模型在多场景泛化的能力满怀期待。一方面表现在,随着大模型性能的提升,AI在更多消费级toC场景加速渗透,消费级场景潜力巨大。另一方面,AI也在过去近十年间完成了从感知、理解到推理性能的全面提升,由此带来定义新一代交互、生产方式、生产关系的可能2对于投资机构来说,大家都对新一代大模型的性能打开和赋能TOC场景感到振奋,因为技术的突破使得纵向构建新的商业模式成为可能a过去几年内,由于toC消费级场景没有大的技术性突破,整个行业陷入了突破性的革新停滞,因此行业内只能不断内卷和重复开发。而类ChatGPT大模型为基础的公司的出现,让行业重拾新的信心和产品/场景定义的激情b同时,我觉得它们也给行业带来一定的反思和激励。在过去一段时间内,资本市场对以OpenAI为代表的、底层基础学科科研导向公司的态度非常审慎,因为它们大部分从非营利机构起步,专注科学底层突破,在看不到快速商业化前景时持续做投入。但相信以后一段时间内,这类公司会得到更多关注和资本配置3但这并不意味着相关创业公司的前景一定乐观,因为从目前来看,受限于算力、历史投入、科技人才密度、数据量级、资金实力等方面,大型科技公司的优势明显优于创业公司。大模型通过被持续调用、喂新数据、训练,不断强化性能,并在应用场景上泛化,有较大可能挤压提供小模型闭环方案的一些创业公司的生存空间4所以,我们目前会更关注大型科技公司在底层模型上的动态,以及业务流能借用大模型的性能、并且在垂类应用上构建出一定壁垒的创业公司5但以下几种类型的创业公司也会受到我们的关注a一是市场上已有AI公司对大模型的融合b二是已有消费级公司,借助大模型构建的与现有业务集成起来的新功能c三是以AI为基础研究导向的新科研团队。一旦它们构建了相应的壁垒,未来非常值得期待生成式AI的创业者要技术为先1CHATGPT的出现,给全社会带来很大震动。它来源于核心算法模型上的突破(例如:TRANSFORMER),可从海量文本(其中包含部分程序代码)中以无监督学习方式训练出巨大参数量的大型语言模型(GPT系列),具备强大的自然语言理解和生成能力,并“涌现”出一些之前业界从未想象到的其他能力,例如基础的世界知识、上下文学习、基础推理等2与此同时,通过程序代码学习、人类反馈的强化学习和有监督学习等进一步的微调训练,可使其在人机交互和内容输出方面的体验更加友好。语言是人类重要的沟通手段,而且还是各类知识和推理的主要载体,GPT系列大型语言模型的通用性更好,可无示例或少示例直接完成部分下游任务,应用范围也更广,这都让人们看到了更大的发展潜力和空间3此前,我们一直想做的是让AI代替人类完成“简单”的重复性劳动,例如安防、驾驶等,从而解放人类去做更“难”的知识性和创意类工作,因为我们倾向于认为机器不具备这种类型的能力;但如今的生成式AI,率先挑战的是知识工作者,它掌握了海量知识,可以轻松写出各类文章与程序代码,在某些方面的创意能力甚至超过人类4OPENAI的CEO山姆·阿尔特曼认为,我们过去对于劳动难易的划分准则可能有问题,现在看来AI最先取代的可能是知识工作者和创意工作者的工作a最近,类似赛道的项目很火,我们也在积极地看。曾有人问我,大家会不会“抢项目”?我的回答是,暂时还好。因为在上一轮的AI发展浪潮里,大家都投了很多,但实际产出与效果没有预期的那么明显。所以,我观察下来,现在投资行业持理性观望态度的居多,但我认为这确实是一个很大的机会b上一轮AI热潮,大家投资的主要是以深度学习为代表的判别式AI。峰瑞在2021年下半年开始关注生成式AI赛道。我们看到AI语言大模型在不断更迭升级,从2022年开始很长一段时间内,据说平均每4天就会出现一个新的大型语言模型,发展速度很惊人c不止是OpenAI,包括美国的很多大厂也推出了自己的大模型,虽然有些模型没有开放出来给外部使用。AI发展至今,对“参赛者”的筛选是残酷的,入局早的已经有了先发优势,因为其对行业的集中度要求比较高d从已经推出的大模型本身来看,它主要是靠规模取胜,这背后需要高密度的顶尖科研人才、巨量计算资源、海量训练数据,以及良好的用户或合作者生态。只有同时具备这几个重要条件,才能更好地训练模型、拓展应用边界、给未来的商业化打下基础。在这一点上,规模较大的公司(大厂)相对更有优势5国内在AI领域的发展相较于美国慢了一步,这体现在人才储备、数据积累以及资源投入上。不过随着中国逐渐出现自己的大模型、有更多的人才积累,以及整个研究和行业发展氛围变得更好,以我们的技术迭代效率,相信应该具备追赶的能力6我们认为,当前的生成式AI创业机会分为模型层和应用层两大类,应用层又可分为TOB和TOC两个子类。但除大厂之外,模型层的创业是比较难的,因为前期投入实在太大,可能短期内比如两三年之内创业公司跑出来的概率较低。创业公司可以考虑在垂类模型或者应用层有所突破但是在应用层创业,在做商业模型设计的时候要警惕模型层的边界,最好保持一定的“安全距离”1以新锐独角兽公司JASPER.AI为例,它基于模型提供商OPENAI的GPT3模型的API,构建自己的商业模式,但是没想到OPENAI后来推出了CHATGPT这个新产品,免费提供了部分JASPER.AI的功能,某种程度上影响了JASPER.AI的发展a2022年,我们投资了一家生成式AI公司,它的主要技术亮点是视频和直播的数字内容生成,商业模式是围绕直播和短视频电商的内容制作、数据归因、生意参谋等服务。这个商业模式有足够的行业纵深,且具备明确的商业化能力。这类模式相对好很多b从去年下半年起,我们看了很多生成式AI的项目,我觉得这个领域的创业要点是:技术为先,场景为重2创业者首先要对技术有深刻的认知,要对技术有不断学习深挖应用的能力,而非拿个模型直接简单使用;其次是,当前这个领域处在科研快速迭代和广泛传播的状态,技术的溢出效应很明显,这意味着同一项技术对大小平台的赋能作用相差不大,因此,创业者必须深入到行业场景中去,构建自己独特的壁垒3比如用户群体、行业知识、产品服务、技术算法等等,从而避免陷入同质化竞争的红海中去。CHATGPT是AI技术范式变化,看好国内创业公司夏令明势资本合伙人CHATGPT的大火,并不是突然发生的4其背后的技术趋势和变革已经发展很多年了。从OPENAI的GPT-1/2/3,再到现在的3.5,每一代都在进步,终于实现了通用人工智能AGI的突破,产生了AI技术范式的变化5明势资本从2021年底、2022年初就在考察、投资和布局这一赛道。在明势资本看来,目前市场上有三类AI公司有投资价值:一是专注于大模型的公司,以OPENAI为代表;二是既做大模型,又做直接应用垂直一体化的公司,比如MIDJOURNEY;三是调用大模型API的公司,与第一类公司合作,重点开发具体场景的AI应用公司,如JASPER等6大模型方面,尽管它的技术壁垒和门槛相对较高,但中国的创业公司从迭代效率和反馈质量上而言,比欧美很多公司更具优势。所以即使国内的大模型现在跟海外有差距,但我们认为这些技术差距是可以追赶上的在此基础上,我们认为国内创业公司也有很大发展机会1尽管之前大厂也都在做大模型,但过去他们的投入和重视度并不够,因为他们没有以工程化的方式去做大模型,所以目前大厂的大模型,在实用性上相对不足。而国内的大学研究院也不是基于工程化产品化的视角去做,也存在一定缺陷2另外,CHATGPT这类应用,未来可以广泛应用到生活的各个方面,在数字经济的各个方面都有结合的机会,也会相应产生非常多的丰富应用,这肯定会带动一批创业公司去做探索和尝试3这一背景下,国内已有少数具备很强技术研发和工程化能力的创业公司投入大模型研发,甚至比国内大厂有先发优势4而通过明势已经投资的公司,我们也能深刻体验到新一代端到端数据驱动模型的价值。最开始的模型相比于上一代AI模型并没有显着优势,但在数据驱动下,以两个月一迭代的频率推进,就会发现模型的能力呈现指数型增长,很快就能达到显着超越传统模型的效果5数字经济时代,无论是工作还是生活场景,都存在着海量的文字、代码、图片、声音、视频的生成和理解需求,人类对于效率、成本和体验的追求是无止境的,所以大家都在期待AI能够在各个领域发挥作用,但目前它还无法完成高度抽象、高质量或高可信度的任务6因此,我认为如今CHATGPT只是新一代AI技术的起步,即技术与商业刚开始产生交集,这个交集会越来越大,未来技术的天花板以及它带来的商业可能性还是非常广阔的AI大模型的未来:赋能万业的“水电煤”1如今,AIGC把人工智能技术带向了一个新的高度,是人工智能发展过程中一个非常重要的拐点。AI企业也从主要集中在深度学习的判别式AI,发展为产出新内容的生成式AI,这是技术的一个大的飞跃a从技术层面分类,我们把整个生成式AI分成了三层。底层是生成式AI的基础设施层,中间为最重要的模型层,以及最上层的依赖于底座模型的应用层b在我看来,今天生成式AI所依托的超大规模语言模型是一个更先进的算法架构,集中了人类的全部数据,汇集大量算力,进行集约化训练,训练出来的AI能力供应所有用户使用,这也是十几年前AI界专家所设想的那样,AI未来一定会成为类似“水电煤”的人类公共资源c只有这样,才能做到AI赋能万业。所有行业应用中,目前AI技术的渗透率只有百分之二三十,有些行业虽然已经实现了这一渗透率,但只是应用在一些比较浅层的商业节点,离全面赋能行业还很远。因此,我们也考察并划分了更具投资和创业价值的领域d智算平台更适合有规模效应,如已有的公有云平台,或数据中心运营方介入2而工具链方面,随着大模型持续发展迭代,用更好的工具去帮助大模型的训练和管理去降本增效,一定是有机会的,且会有一些顶级AI工程人才不断进入,我觉得这肯定是一个很标准的VC投资机会a在闭源模型及API服务领域,未来肯定也会有越来越多科技大厂进入,创业公司是否还有进入的机会,我觉得值得观望,因为这对于人才密度的要求和资本的投入都是巨大的b技术开发应用的基础上,我觉得未来的主要趋势,是利用第三方模型构建应用的方式。我们预计会有成千上万个创业公司涌入这个市场。对于创业者而言,不用从头建一个AI模型,只需要直接利用这些底座模型的能力,加上他们对于场景和行业的深刻理解,就可以做出一家应用型公司3此外,某些特定的领域、行业、场景,可能会有一些创业者选择从头做,自建模型及应用,端到端,我觉得也是有机会的a中国在大模型的研发上,需要给自己更多的时间,才能够慢慢地达到全球领先水平。因为围绕着OpenAI或者西方科技大厂的大模型已经构建出了一个初步的生态,国内科技大厂或者创业公司的大模型在技术和工程上也有很多地方需要不断追赶b如果只是做出大模型,没有人去用,缺少完整生态能力,也是没有任何意义的4因此,我非常看好生成式AI和大模型,它的出现标志着一个巨大的AI开发范式的转换,将会真正的被利用到更多应用场景。但现在也处于科技的炒作周期,叠加了很多情绪和期待,一位美国AI研发人员说,IGNORETHEHYPECYCLE,BUILDBORINGBUSINESS,就是忽略这种短暂的炒作周期,而是去建立无聊生意5在我看来,AI能力的真正体现,并不仅仅局限于作画、对话聊天领域。AI很明显是一个能够改变人类发展的技术,它应该融入所有行业、所有应用。想要真的实现这一步,我觉得目前我们才刚刚开始,它远比我们今天看到的一些示范性的TOC应用更有价值6在未来的三五年加速发展后,AI可能不只是停留在媒体或者人们的幻想中。十年后,它有可能真正去实现大规模落地,赋能万业大公司“疯狂”,一级市场相对理性1短短几个月内,CHATGPT的用户迅速破亿,且还在飞速增长。即使对投资人而言,这也是一个非常现象级的情况。种种迹象都表明,它的产品或技术肯定有独到的地方,或者值得期待的价值趋势2目前的大背景是,国外的大公司如微软、谷歌等都动作频频,甚至可以称之为“疯狂”,这也会使整体市场发展得非常迅速。不过,从国内目前的状况来看,无论是大公司还是创业公司,包括投资人,更多还处于跟随的状态3确实从这两年能感受到,AIGC的进展飞速,尤其在海外,无论是模型端,还是应用层面,甚至包括现在发布的一些产品,在C端用户体验层面,都达到了一定的高度,并可以进入消费级市场4技术上的突破,可能已经到了一个相对临界点的状态。因为人工智能的想象力其实是挺高的,它确实是新的一个生长性方式,包括人机交互的方式,已经从原来的机器语言(编程、代码)等,到现在可以理解自然语言,其实这是一个非常大的突破。从这方面来说,很多软件和硬件,包括一些互联网产品都有可能因其升级,或被替代a一方面,对已有的部分传统产品,人工智能可以加持一些应用。具体体现在产品上,如谷歌或微软的搜索,如果加上类ChatGPT技术或者应用,传统的搜索可以进行升级,提升整体使用的体验,对信息的处理和生成也可以更加优化b另一方面,人工智能可以产出新的产品或玩法,也就是所谓的替代。比如自动生成图片等功能,此前图片的产出需要人力手工绘图,但现在可以利用AI自动生成图片,从而减少人力和时间成本。此外,在AI的加持下,可能还有一些新的产品或新的应用面世5除了互联网产品这些软件外,一些硬件产品,例如家电等工具,如果配备相应的人工智能技术应用,也可能会有全新的服务和体验。由此衍生出来的未来行业方向或模式,对于相关公司来说,都存在发展机会。且随着人工智能技术的不断发展,它确实可以影响到很多行业,包括不同的一些模式。对于它的未来,我觉得确实是值得期待的6但体感上,我觉得现在外部关于行业讨论的声音有点太多了,其实一级市场(投资行业)对于这一赛道的看法还是相对理性的。因为对于国内来说,大部分创业公司或者投资,都还处于早期或跟随状态ChatGPT算力知多少2/15在春节假期复工前,我们就非常明确ChatGPT会是今年计算机预期差最大的主线观点,也是全市场首篇明确此观点的报告。到了现在大概过了近一个月的时间,大家已经看到整个ChatGPT行情的扩展,我们的预测已经得到了验证1一周前我们不断强调CHATGPT投资转向算力与场景,上周二时我们也是全市场唯一明确提示浪潮信息,到今天公司已经是全市场的关注的焦点。大家最关注的是CHATGPT的算力和到底如何量化浪潮信息的受益程度aChatGPT的总算力消耗约为3,640PF-days。至少需要7-8个算力500P的数据中心(投资预计超过200亿)才能支撑ChatGPT的运行。从数据中心的整个成本构成来看,一半左右的成本需要专门投入到服务器领域,体量约在一两百亿之间b另外需要关注ChatGPT是持续升级的,算力消耗呈几何倍增加。GPT、GPT-2和GPT-3(当前开放的版本为GPT-3.5)的参数量从1.17亿增加到1,750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练单次的成本就高达460万美元2所以从一方面说明了整个CHATGPT的算力投入,是一个几乎只有巨头或者大国的科技巨头才能做的事3第二个可以看到CHATGPT会成为大国科技巨头的必争之地,因为没有哪一个重要的国家和科技巨头会把CHATGPT这么一个战略级的入口拱手让人。最近我们也做了相对的产业研究,关于国内的各大互联网巨头,如BAT字节、三六零等4原来最大的问题是过去两年国内互联网的资本开支比较收缩,导致浪潮信息的估值在启动的时候也只在一个底部a现在不同,现在所有的科技巨头都看到了机会,美国的ChatGPT也不是传统的科技巨头最先做出来的,是openAI这个专门为了通用人工智能成立的实验室做的,所以核心在于原来商业化的公司没有想到往这个方向去勐烈的投入和迭代,没有想到会出现这么一个令人震惊的产品b所以认为它不是技术上的突破,而更愿意称它为是一个通用工程领域的重要拐点。因为是通用工程的产品所以资本市场的感知和长远落地的速度非常快,另一个方面就是科技巨头看到了会出现这个成果,他们反应的速度也很快。所以在我们产业研究中,一线的国内巨头公司今年大概率会加强在AI算力领域的投资从标的层面,大家应该都会同意英伟达处于所有AI芯片整个源头,是最受益的一个领域,可惜英伟达不是在国内的上市的公司,所以我们选择投资标的有两个思路1第一个,在全球的巨头的资本扩张的情况下,我们有哪一个数据中心底层产业链是在全球占据比较高的份额的,这里面像通信的光模块最近大家已经挖掘了,这个是相当于是整个英伟达AI算力的一条产业链2第二个就是国内的在使用英伟拉GPU来做AI服务器的,在GPU和AI芯片的下游,而且这个行业份额非常的集中a大家都知道浪潮信息,它整个的服务器在国内是当之无愧的第一,全球第二,它整个服务器的份额占据全中国大概接近一半的份额,但它AI的服务器占据了整个BAT为代表的互联网市场的绝大部分的份额,它的份额的程度是超过所有的剩余的参与者的总和的b而且在BAT可能份额会更高,甚至会达到八九十。所以基本上,一旦互联网巨头开始不计代价往AI的领域、算力领域投资,浪潮信息将是首要的受益者3过去两年,因为大家对互联网资本开支的担心,使它成为了一个低估值,最低只有15倍的一个公司。新的资本开启的周期,它的估值向上弹性,包括资本链业绩最先出现的速度,可能都会是CHATGPT产业里面非常快的。这也是为什么我们从上周市场还没有声音的时候,周二开始非常旗帜鲜明的开始强推浪潮信息4另外一个大家比较关注的几个方向a第一个是大家希望量化一下对它的弹性,ChatGPT一次版本升级从数据训练量就上了3个数量级。从GB到TB的一个规模,后面可能还会迭代到GPT4,这是一个指数级增大的算力需求i以目前的版本去算,一个互联网巨头或科技巨头想要从0开始支撑区别的应用,国内有能力往领域去做的估计不少于6家iiBAT字节,京东、360,包括讯飞等等这个里面。浪潮在各类服务器的份额作为龙头地位,将充分受益此类催化。对于估值到今天还只有20倍左右的浪潮信息来说,整个估值体系包括业绩弹性都是相当大的b第二个市场比较关注的一点是关于上游的AI芯片的美国对我们的制裁或者限制。这里我们注意三点i第一点,AIGPU的芯片,它是一个通用的芯片,包括A100以上,现在被限制住,但实际上越通用的芯片是越难被限制的ii第二个就是AI芯片的上游。现在绝不是GPU一家独大,它是一个多分类的。以浪潮的AI服务器为例,它根据客户的需求,包括了GPU、FPGA,包括寒武帝这Asic专用的AI的芯片,可选择的范围会非常的多。实际上就规避了单一的芯片,尤其单一芯片里面高算率的供应链的一些影响iii第三个,现在最大的算力的消耗AI的计算跟以往不同,它包括训练和推理。它最大的算力消耗是AI训练芯片。AI训练芯片它本质上不是一个耗损品,不像手机芯片一样卖多少,每年消耗这么多。它本质上是一个后台的工具,它只有在训练的峰值的时候才会消耗到这么大的算力。所以就像你的办公电脑一样,你其实提前存很多并不会消耗,只等你峰值的时候来用它c所以依据这三个方面,其实大家对上游芯片的AI芯片的影响或者瓶颈的制裁不用太过去担心,而且这个时候往往体现了浪潮的渠道的地位,它已经是英特尔,包括英伟达在国内最大的分销商之一了,所以浪潮的渠道地位反而更加的显着5另外一个,关于AI芯片,AI服务器,还有一点就是AI服务器,如果大家关注浪潮的业绩拆分,包括浪潮的AI服务器的毛利率基本上是传统的互联网服务器的毛利率的两倍a为什么会这么高?是因为AI服务器它本身并不像传统服务器那样,已经是一个非常标准化的CPU,都是一样的操芯。AI估计刚刚说了i第一个,游芯片不同ii第二个,它包括了推算、训练和推理不同的需求,底层实际上是没有统一的操作系统的。它的训练的框架有的客户可以自己做,像一些互联网巨头,像浪潮,它自己会提供底层的AI训练和对你的整个底层的类似于超系统的整个深度学习的框架,来提供附加提问b而且浪潮在技术上还做了参数量已经超过了GPT3,在21年就已经推出了叫做源这种大模型系统,所以它本质上也是一个大模型,包含算力大模型的给各个行业。虽然一些科技巨头会自己做,但是它是给各个行业赋能的一个潜在的供应商,本身算力又受到很明确的提升的估值也属于低位的,同时又是潜在的AI的大模型的各个行业赋能者c当前20倍的估值,虽然最近一周推荐之后涨了很多,但是我自己判断才刚刚开始,还有更大的机会。这是我们今天关于浪潮的判断d而按照以往的惯例,互联网的资本开支通常在财报的开始,也就是三四月份会定全年的大概规划,而在近期互联网的动向中,都是要加大在AI上面投入,所以应该在二季度就会看到一些业绩的拐点,或者一些标志性的大订单开始出现,所以像浪潮这种基本上是最大的收益面最先会在ChatGPT里面,算力层面确实是业绩最容易出现拐点的一个公司另外我们有几个应用层面1第一个就是金山办公,其实就是最直接的,像OFFICE,它的估值的天花板,但市场还没意识到彻底的会打开。原来靠信创大家会觉得固执,天花比较有限。但是现在我从我们团队对线上办公的了解,一定会开放去引入CHATGPT的能力所以它的弹性也是相当大2第二个,梦网科技,我们最近推荐的5G消息是整个CHATGPT最佳的落地的窗口。5G消息在两年前刚推出的时候,大家看运营商的白皮书CHATBOT,它的核心功能并不是去蹭刚出来的CHATGPT,一旦引流之后,原来给每个企业发送的短信,实际就变成一个发送的智能的、帮业务客户综合一体的数据。所以它从每个短信1毛钱左右,可以完全升级成SAAS服务,按广告点击业务分成各种商业模式3从巨头的角度,跟这种5G消息的龙头公司去合作,会一下子获得上百万的客户,同时每一个客户它的垂直场景对话的数据同时拥有。所以对技术来说,它也是第一优先的选择。所以像梦网科技这种去年整个的历史的最低点,今年开始整个业绩反转,基本面急剧向上,再加上CHATGPT的历史性窗口,我们认为这公司后面可能会弹力相当的大4第三个方向,我们觉得在一些金融的,代替初级分析师的,像同花顺等,可能会有非常大的潜意做到整个的,这是我们目前在场景里建议可以重点关注的方向5最后再强调一下我们的观点,CHATGPT一定是今年计算机最大的主线,我们是在春节回来前唯一的一个明确的说了今年主线的,在整个市场还没有像现在大家看到的这么全面扩散,引领整个市场的时候,我们依然认为大家可以重点去关注这个方向,我们也会提供更多更好的标的风险提示:技术落地不及预期,竞争格局加剧ChatGPT算力需求测算2/15大模型训练热潮下,算力基础设施有望迎来产业机遇1CHATGPT发布之后,引发了全球范围的关注和讨论,国内各大厂商相继宣布GPT模型开发计划。我们认为,以GPT模型为代表的AI大模型训练,需要消耗大量算力资源,主要需求场景来自:预训练+日常运营+FINETUNE2以预训练为例,据我们测算,进行一次CHATGPT的模型预训练需要消耗约27.5PFLOP/S-DAY算力3基于此,我们认为,随着国产大模型开发陆续进入预训练阶段,算力需求持续释放或将带动算力基础设施产业迎来增长新周期4产业链相关公司包括a算力芯片厂商:景嘉微、寒武纪、海光信息、龙芯中科、中国长城等b服务器厂商:浪潮信息、中科曙光等cIDC服务商:宝信软件等ChatGPT:大模型训练带来高算力需求1训练CHATGPT需要使用大量算力资源。据微软官网,微软AZURE为OPENAI开发的超级计算机是一个单一系统,具有超过28.5万个CPU核心、1万个GPU和400GB/S的GPU服务器网络传输带宽。据英伟达,使用单个TESLA架构的V100GPU对1,746亿参数的GPT-3模型进行一次训练,需要用288年时间2此外,算力资源的大量消耗,必然伴随着算力成本的上升,据LAMBDA,使用训练一次1,746亿参数的GPT-3模型所需花费的算力成本超过460万美元。我们认为,未来拥有更丰富算力资源的模型开发者,或将能够训练出更优秀的AI模型,算力霸权时代或将开启需求场景:预训练+日常运营+Finetune1具体来看,AI大模型对于算力资源的需求主要体现在以下三类场景a模型预训练:ChatGPT采用预训练语言模型,核心思想是在利用标注数据之前,先利用无标注的数据训练模型。据我们测算,训练一次ChatGPT模型(13亿参数)需要的算力约27.5PFlop/s-dayb日常运营:用户交互带来的数据处理需求同样也是一笔不小的算力开支,我们测算得ChatGPT单月运营需要算力约4,874.4PFlop/s-day,对应成本约616万美元cFinetune:ChatGPT模型需要不断进行Finetune模型调优,对模型进行大规模或小规模的迭代训练,预计每月模型调优带来的算力需求约82.5~137.5PFlop/s-day2算力芯片+服务器+数据中心,核心环节有望率先受益我们认为,随着国内厂商相继布局CHATGPT类似模型,算力需求或将持续释放,供给端核心环节或将率先受益a算力芯片:GPU采用了数量众多的计算单元和超长的流水线,架构更适合进行大吞吐量的AI并行计算b服务器:ChatGPT模型训练涉及大量向量及张量运算,AI服务器具备运算效率优势,大模型训练有望带动AI服务器采购需求放量c数据中心:IDC算力服务是承接AI计算需求的直接形式,随着百度、京东等互联网厂商相继布局ChatGPT类似产品,核心城市IDC算力缺口或将加大。关注AI景气周期下,算力基础设施产业机遇我们认为,国产厂商未来或将训练出自己的GPT模型,带动算力设施产业迎来景气周期3相关公司包括a算力芯片厂商:景嘉微、寒武纪、海光信息、龙芯中科、中国长城等b服务器厂商:浪潮信息、中科曙光等cIDC服务商:宝信软件等4风险提示:宏观经济波动;下游需求不及预期ChatGPT有望带动算力需求需求端1据OPENAI测算,自2012年以来,全球头部AI模型训练算力需求3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。而摩尔定律认为,芯片计算性能大约每18-24个月翻一番a因此,AI训练模型算力需求增长与芯片计算性能增长之间的不匹配,或将带来对算力基础设施供给需求的快速增长b我们认为,考虑到算力对于AI模型训练效果的关键性作用,拥有更丰富算力资源的模型开发者,或将能够训练出更优秀的AI模型,算力霸权时代或将开启2具体来看,AI大模型对于算力资源的需求主要体现在以下三类场景a模型预训练带来的算力需求模型预训练过程是消耗算力的最主要场景。ChatGPT采用预训练语言模型,核心思想是在利用标注数据之前,先利用无标注的数据,即纯文本数据训练模型,从而使模型能够学到一些潜在的跟标注无关的知识,最终在具体的任务上,预训练模型就可以利用大量的无标注数据知识i在Transformer的模型架构下,语言预训练过程可以根据上下文一次处理所有输入,实现大规模并行计算。通过堆叠多个解码模块,模型的层数规模也会随着提升,可承载的参数量同步增长。与之相对应的,模型训练所需要消耗的算力也就越大ii我们预计,训练一次ChatGPT模型需要的算力约27.5PFlop/s-day。据OpenAI团队发表于2020年的论文《LanguageModelsareFew-ShotLearners》,训练一次13亿参数的GPT-3XL模型需要的全部算力约为27.5PFlop/s-day,训练一次1,746亿参数的GPT-3模型需要的算力约为3,640PFlop/s-dayiii考虑到ChatGPT训练所用的模型是基于13亿参数的GPT-3.5模型微调而来,参数量与GPT-3XL模型接近,因此我们预计训练所需算力约27.5PFlop/s-day,即以1万亿次每秒的速度进行计算,需要耗时27.5天b此外,预训练过程还存在几个可能的算力需求点i模型开发过程很难一次取得成功,整个开发阶段可能需要进行多次预训练过程ii随着国内外厂商相继入局研发类似模型,参与者数量增加同样带来训练算力需求iii从基础大模型向特定场景迁移的过程,如基于ChatGPT构建医疗AI大模型,需要使用特定领域数据进行模型二次训练c日常运营带来的算力需求ChatGPT单月运营需要算力约4,874.4PFlop/s-day,对应成本约616万美元。在完成模型预训练之后,ChatGPT对于底层算力的需求并未结束,日常运营过程中,用户交互带来的数据处理需求同样也是一笔不小的算力开支i据SimilarWeb数据,2023年1月ChatGPT官网总访问量为6.16亿次。据Fortune杂志,每次用户与ChatGPT互动,产生的算力云服务成本约0.01美元。基于此,我们测算得2023年1月OpenAI为ChatGPT支付的运营算力成本约616万美元ii据上文,我们已知训练一次1,746亿参数的GPT-3模型需要3,640PFlop/s-day的算力及460万美元的成本,假设单位算力成本固定,测算得ChatGPT单月运营所需算力约4,874.4PFlop/s-dayFinetune带来的算力需求1模型调优带来迭代算力需求。从模型迭代的角度来看,CHATGPT模型并不是静态的,而是需要不断进行FINETUNE模型调优,以确保模型处于最佳应用状态a这一过程中,一方面是需要开发者对模型参数进行调整,确保输出内容不是有害和失真的b另一方面,需要基于用户反馈和PPO策略,对模型进行大规模或小规模的迭代训练2因此,模型调优同样会为OPENAI带来算力成本,具体算力需求和成本金额取决于模型的迭代速度供给端:核心环节有望率先受益1算力芯片:AI算力基石,需求有望大规模扩张GPU架构更适合进行大规模AI并行计算,需求有望大规模扩张。从CHATGPT模型计算方式来看,主要特征是采用了并行计算a对比上一代深度学习模型RNN来看,Transformer架构下,AI模型可以为输入序列中的任何字符提供上下文,因此可以一次处理所有输入,而不是一次只处理一个词,从而使得更大规模的参数计算成为可能b而从GPU的计算方式来看,由于GPU采用了数量众多的计算单元和超长的流水线,因此其架构设计较CPU而言,更适合进行大吞吐量的AI并行计算。基于此,我们认为,随着大模型训练需求逐步增长,下游厂商对于GPU先进算力及芯片数量的需求均有望提升2单一英伟达V100芯片进行一次CHATGPT模型训练,大约需要220天a我们以AI训练的常用的GPU产品—NVIDIAV100为例。V100在设计之初,就定位于服务数据中心超大规模服务器。据英伟达官网,V100拥有640个Tensor内核,对比基于单路英特尔金牌6,240的CPU服务器可以实现24倍的性能提升b考虑到不同版本的V100芯片在深度学习场景下计算性能存在差异,因此我们折中选择NVLink版本V100(深度学习算力125TFlops)来计算大模型训练需求c据前文,我们已知训练一次ChatGPT模型(13亿参数)需要的算力约27.5PFlop/s-day,计算得若由单个V100GPU进行计算,需220天;若将计算需求平均分摊至1万片GPU,一次训练所用时长则缩短至约32分钟d全球/中国GPU市场规模有望保持快速增长。据VMR数据,2021年全球GPU行业市场规模为334.7亿美元,预计2030年将达到4,773.7亿美元,预计22-30年CAGR将达34.4%。2020年中国GPU市场规模47.39亿美元,预计2027年市场规模将达345.57亿美元,预计21-27年CAGR为32.8%3服务器:AI服务器有望持续放量CHATGPT主要进行矩阵向量计算,AI服务器处理效率更高。从CHATGPT模型结构来看,基于TRANSFORMER架构,CHATGPT模型采用注意力机制进行文本单词权重赋值,并向前馈神经网络输出数值结果,这一过程需要进行大量向量及张量运算a而AI服务器中往往集成多个AIGPU,AIGPU通常支持多重矩阵运算,例如卷积、池化和激活函数,以加速深度学习算法的运算。因此在人工智能场景下,AI服务器往往较GPU服务器计算效率更高,具备一定应用优势b单台服务器进行一次ChatGPT模型训练所需时间约为5.5天。我们以浪潮信息目前算力最强的服务器产品之一—浪潮NF5,688M6为例。NF5,688M6是浪潮为超大规模数据中心研发的NVLinkAI服务器,支持2颗Intel最新的IceLakeCPU和8颗NVIDIA最新的NVSwitch全互联A800GPU,单机可提供5PFlops的AI计算性能c据前文,我们已知训练一次ChatGPT模型(13亿参数)需要的算力约27.5PFlop/s-day,计算得若由单台NF5,688M6服务器进行计算,需5.5天d大模型训练需求有望带动AI服务器放量。随着大数据及云计算的增长带来数据量的增加,对于AI智能服务器的需求明显提高。据IDC数据,2021年全球AI服务器市场规模为156亿美元,预计到2025年全球AI服务器市场将达到318亿美元,预计22-25年CAGR将达19.5%e2021年中国AI服务器行业市场规模为350.3亿元,同比增长68.6%,预计22-25年CAGR将达19.0%。我们认为,随着ChatGPT持续火热,国内厂商陆续布局ChatGPT类似产品,AI服务器采购需求有望持续增长,市场规模或将进一步扩张4数据中心:核心城市集中算力缺口或将加剧aIDC算力服务是承接AI计算需求的直接形式。ChatGPT的模型计算主要基于微软的Azure云服务进行,本质上是借助微软自有的IDC资源,在云端完成计算过程后,再将结果返回给OpenAI。可见,IDC是承接人工智能计算任务的重要算力基础设施之一,但并不是所有企业都需要自行搭建算力设施b从国内数据中心的业务形态来看,按照机房产权归属及建设方式的角度,可分为自建机房、租赁机房、承接大客户定制化需求以及轻资产衍生模式四种。若使用某一IDC全部算力,可在11分钟完成一次ChatGPT模型训练i我们以亚洲最大的人工智能计算中心之一—商汤智算中心为例。据商汤科技官网,商汤智算中心于2022年1月启动运营,峰值算力高达3,740Petaflopsii据前文,我们已知训练一次ChatGPT模型(13亿参数)需要的算力约27.5PFlop/s-day,计算得若使用商汤智算中心全部算力进行计算,仅需11分钟即可完成5AI训练需求有望带动IDC市场规模快速增长。据中国信通院,2021年国内IDC市场规模1,500.2亿元,同比增长28.5%。据信通院预计,随着我国各地区、各行业数字化转型深入推进、AI训练需求持续增长、智能终端实时计算需求增长,2022年国内市场规模将达1,900.7亿元,同增26.7%a互联网厂商布局ChatGPT类似产品,或将加大核心城市IDC算力供给缺口。i据艾瑞咨询,2021年国内IDC行业下游客户占比中,互联网厂商居首位,占比为60%;其次为金融业,占比为20%;政府机关占比10%,位列第三ii而目前国内布局ChatGPT类似模型的企业同样以互联网厂商为主,如百度宣布旗下大模型产品“文心一言”将于2022年3月内测、京东于2023年2月10日宣布推出产业版ChatGPT:ChatJDb另一方面,国内互联网厂商大多聚集在北京、上海、深圳、杭州等国内核心城市,在可靠性、安全性及网络延迟等性能要求下,或将加大对本地IDC算力需求,国内核心城市IDC算力供给缺口或将加大6产业链相关公司梳理a算力芯片厂商:景嘉微、寒武纪、海光信息、龙芯中科、中国长城b服务器厂商:浪潮信息、中科曙光等cIDC服务商:宝信软件等风险提示:宏观经济波动。若宏观经济波动,产业变革及新技术的落地节奏或将受到影响,宏观经济波动还可能对IT投资产生负面影响,从而导致整体行业增长不及预期。下游需求不及预期。若下游数字化需求不及预期,相关的数字化投入增长或慢于预期,致使行业增长不及预期ChatGPT开启AI新纪元2/9核心观点1CHATGPT,人工智能的旷世巨作。CHATGPT是一种聊天机器人软件,OPENAI于2022年11月推出的聊天机器人,具备人类语言交互外复杂的语言工作,包括自动文本生成、自动问答、自动摘要等多重功能,应用场景广阔,相较于上个版本更像人类一样聊天交流2OPENAI除了CHATGPT还包括DALL·E2、WHISPER等项目分别是自动绘图、自然语言翻译等软件。OPENAI的商业模式即API接口收费,可根据不同项目需求进行收费,我们认为其商业模式属于底层模型开放性标准化SAAS服务模式。我国仍处于初期阶段,以辅助生成内容服务为主,我们认为未来有望形成相关SAAS模式aChatGPT促使AIGC快速商业化发展。GPT系列是AIGC的一种商业化方向,目前AIGC已经实现商业化的方向有AI写作、AI作图、AI底层建模,未来AI生成视频和动画领域有望快速商业化发展bAIGC也被认为是继UGC、PGC/UGC之后的新型内容生产方式,有望解决PGC/UGC创作质量参差不齐或是降低其有害性内容传播等问题,有望在实现创意激发,提升内容多样性的同时降本增效,并大规模使用。目前我国已经有商业化例如百度AIGC数字人主播度晓晓、百家号TTV等3AIGC蓬勃发展,相关厂商有望受益。我们认为AIGC的出世会产生革命性的影响,同时有望赋能千行百业。我们认为受益厂商分为三类,分别是aAI处理器厂商,具备自研AI处理器的厂商可以为AIGC的神经网络提供算力支撑,AI处理器芯片可以支持深度神经网络的学习和加速计算,相比于GPU和CPU拥有成倍的性能提升和极低的耗电水平bAI商业算法商业落地的厂商,原因是AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势和技术领先性cAIGC相关技术储备的应用厂商,相关厂商有望在降本增效的同时实现创意激发、提升内容多样性并打开海量市场4投资建议:关注三条投资主线a具备自研AI处理器的厂商,受益标的为寒武纪、商汤、海光信息b具备AI算法商业落地的厂商,重点推荐科大讯飞,其他受益标的为:汉王科技、拓尔思、海天瑞声、虹软科技、云从科技、格灵深瞳cAIGC相关技术储备的应用厂商,受益标的为万兴科技、中文在线、阅文集团、昆仑万维、视觉中国5风险提示:核心技术水平升级不及预期的风险、AI伦理风险、政策推进不及预期的风险、中美贸易摩擦升级的风险AI纪元,ChatGPT1CHATGPT是一种聊天机器人软件:全名为CHATGENERATIVEPRE-TRAINEDTRANSFORMER,是OPENAI于2022年11月推出的聊天机器人,该软件使用方便快捷,只需向CHATGPT提出需求,即可实现文章创作、代码创作、回答问题等功能aChatGPT功能强大:ChatGPT目前仍以文字方式互动,而除了通过人类语言交互外,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务bChatGPT关注度较高:截至于2022年12月4日,上线仅5天,OpenAI估计ChatGPT已经拥有超过100万用户。此外,根据《纽约时代》报道,GPT的下一个版本GPT-4有望于2023年某个时候推出cChatGPT打开海量应用场景:ChatGPT应用场景广泛,拥有潜在空前蓝海,其功能覆盖各个板块,我们将其分成生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作、一般推理和其他七部分2我们认为,CHATGPT经历了人工智能发展的三大趋势a机器学习:2012年左右,随着基础算力的提升,全球已经开启人工智能热潮即大数据时代b神经网络:2015年左右开始繁荣爆发,神经网络是实现AI深度学习的一种重要算法cTransformer算法:2017年左右,是图型神经网络的一种,Transformer开始广泛应用于机器翻译之中,逐步取代循环神经网络(RNN),不再使用递归,而是采用了注意力机制进行优化3从算法模式的版本上,CHATGPT已经经历了四个版本,未来有望生成新版本即GPT-4aGPT-3是GPT系列第三代语言预测模型,是OpenAI创建的GPT-2的继任者:GPT-3的应用包括帮助Viable公司快速理解客户反馈、虚拟人陪伴、论文搜索等b我们认为,InstuctGPT可以理解成是GPT-3的微调版本:InstuctGPT模型比GPT-3更擅长遵循指令,且回答更真实,且有害情绪输出大幅下降例如暴力情节c我们认为,ChatGPT可以理解成是GPT-3.5的微调版本:相较于InstructGPT,ChatGPT效果更加真实,模型的无害性实现些许提升,编码能力更强4GPT-4有望打开海量应用:据OPENAI创始人ALTMAN消息,参数预计更大,计算模型优化有望实现更优化,且GPT-4将是纯文本模型。我们认为其"拟人化"能力更强aChatGPT与InstructGPT的相同点:使用来自人类反馈的强化学习(RLHF)来训练该模型bChatGPT与InstructGPT的不同点:可以理解成在“人脑思维”的基础上加入了“人类反馈系统”,是一种奖励模型cChatGPT仍有提升空间,仍有一些限制需要突破:可能写出看似合理但不正确或荒谬的答案,对输入措辞的调整或多次尝试相同的提示很敏感,该模型通常过于冗长并过度使用某些短语5全球AI的“领军企业”OPENAI:OPENAI是美国一个人工智能研究实验室,是促进和发展友好的人工智能,使人类整体受益aOpenAI不仅仅是ChatGPT:OpenAI的业务不仅仅局限于ChatGPT领域,还包括Dall·E2、Whisper等项目bOpenAI的商业模式即API接口收费:客户可以通过OpenAI的强大AI模型构建应用程序,公司按照不同项目的AI模式和不同需求进行收费,对于AI图像系统按不同的图片分辨率定价c对于AI语言文字系统按字符单价收费,对于调整模型和嵌入模型按照文字单价收费,并根据不同的调用模型区别定价d我们认为OpenAI的商业模式属于底层模型开放性标准化SAAS服务模式:公用户通过其API接口接入,并支付平台费用获取相关图像、语言、代码调整服务,OpenAI可获得付费订阅式的SAAS费用,我们认为该商业模式用户粘性极强e目前我国AIGC商业仍处于初期阶段,部分文本、图像等生成的公司仍处于初期阶段,以辅助生成内容服务为主AIGC,星星之火可以燎原1AIGC的含义:AIGC(AIGENERATEDCONTENT)即人工智能自动生成内容可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势2AIGC已经实现的商业化方向:AI写作:例如AI生成文字、写邮件、广告营销等;AI作图:AI自动生成图片;AI底层建模:AIGC生成底层技术开发3AIGC未来商业化发展方向:AI生成视频和动画,目前该领域仍存在连贯性和逻辑性的问题亟待解决4AIGC也被认为是继UGC、PGC/UGC之后的新型内容生产方式:我们认为AIGC在创作成本上具有颠覆性,而且具备降本增效的多重优势,并且有望解决目前PGC/UGC创作质量参差不齐或是降低其有害性内容传播等问题,同时创意激发,提升内容多样性aAIGC有望赋能“千行百业”,我国已有应用案例:百度AIGC技术的数字人主播度晓晓正式“上岗”,百家号TTV技术验证了AIGC的发展潜力b来自人民网、中国青年网等多家媒体通过百家号TTV技术进行内容生产5我们认为AIGC的受益厂商分为三类。AI处理器厂商;AI商业算法商业落地的厂商;AIGC相关技术储备的应用厂商a具备自研AI处理器的厂商可以为AIGC的神经网络提供算力支撑:算力作为数据加速处理的动力源泉,其重要性不言而喻。AI处理器芯片可以支持深度神经网络的学习和加速计算,相比于GPU和CPU拥有成倍的性能提升,和极低的耗电水平b具备AI商业算法落地的厂商具备相关算法的领先性:AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势。算法上,数据标注属于AIGC算法的生成关键步骤,而在自然语言处理、机器视觉等方面,AIGC已经对此方向应用产生深远影响cAIGC相关技术储备的应用厂商有望打开海量市场:相关娱乐、传媒、新闻、游戏、搜索引擎等厂商具备海量文本创作、图片生成、视频生成等需求,随着AIGC的逐渐成熟,相关AI算法不断成熟完善,并结合相关应用,我们认为相关厂商在降本增效的同时,实现创意激发,提升内容多样性,从而打开海量空间投资建议1我们认为AIGC的出世会产生革命性的影响,同时有望赋能千行百业。我们梳理了三条路径图,积极的推荐以下三条投资主线2具备自研AI处理器的厂商,受益标的为寒武纪、商汤、海光信息3具备AI算法商业落地的厂商,重点推荐科大讯飞,其他收益标的为:汉王科技、拓尔思、海天瑞声、虹软科技、云从科技、格灵深瞳4AIGC相关技术储备的应用厂商,受益标的为万兴科技、中文在线、阅文集团、昆仑万维、视觉中国风险提示:核心技术水平升级不及预期的风险、AI伦理风险、政策推进不及预期的风险、中美贸易摩擦升级的风险ChatGPT掀起AI产业新周期2/7ChatGPT问世,AI赛道关注度有望持续提升12022年11月30日,OPENAI公司正式对外发布聊天机器人软件CHATGPT,并迅速在全球范围获得大量用户青睐。目前CHATGPT主要通过提供API、订阅服务等获得收入,随着盈利模式拓展,未来商业落地有望加速2我们认为,CHATGPT受到广泛关注的原因在于能够实现接近人类水平的自然语言处理能力,对话逻辑也已经与人类类似。而CHATGPT成功的背后,来自独特算法模型的加持,验证了单一大模型的实战意义,同时也是AI大模型路线一次里程碑式的胜利3在大模型基础上,GPT得以从1.0逐步演化至2.0、3.0、3.5等版本。而随着用户数量扩张,模型有望加速迭代,产品力持续升级或将带动AI赛道关注度有望持续提升背景:发源于OpenAI,成名于生成式语言1OPENAI成立于2015年,专注于强化学习等AI算法、模型的研发与应用。2019年公司获得微软注资10亿美元,就AZURE业务开发人工智能技术。2023年,微软再次追加百亿投资,深入布局生成式AI技术2随着公司AI技术不断沉淀,产品模型持续演进,GPT模型陆续演化出GPT-2、GPT-3、GPT-3.5等版本。基于微调后的GPT-3.5模型,OPENAI推出CHATGPT软件。目前来看,OPENAI围绕CHATGPT的盈利模式大致分为两种a提供API数据接口,执行自然语言处理任务,按字符数收费bChatGPTPlus提供服务器忙碌时段优先响应等特权,并收取20美元/人/月的订阅服务费原理:AI大模型里程碑式的胜利1我们看到,CHATGPT成功的背后,离不开独特训练模型的加持,核心技术采用了监督学习+奖励模型共同进行语言模型训练。拆解来看,训练过程大致分为三个阶段a训练监督策略模型b训练奖励模型c采用近端策略优化进行强化学习2此外,我们发现,CHATGPT的训练过程存在几个特点a采用的是单一大模b采用的是小样本学习方法c采用人类反馈来微调监督学习d基于此,我们认为,ChatGPT的成功,验证了单一大模型实战意义,有望推动人工智能训练向大模型方向演进模型:单一大模型加持下GPT快速迭代1我们认为,GPT模型强大的语言处理能力,来自底层模型的持续演进。据OPENAI官网,从GPT-1到GPT-2、GPT-3,GPT模型参数量不断提升,从1.17亿大幅提升至15亿、1750亿。而单一大模型的形态是GPT模型得以快速演进的基础,通过大规模语言预训练的方式,模型迅速积累泛化通用的语言能力2此外,GPT3.5开始还引入监督学习过程,人类反馈机制的加入在提升模型准确性、真实性的同时,又降低了参数计算量,使得更大规模的AI学习成为可能。我们认为,随着CHATGPT用户不断扩张,用户反馈或将带来类似监督学习的效果,GPT有望在大模型加持下加速进化投资建议:模型层,应用层,算力层1我们认为,在中国或将训练出国产的GPT模型,而GPT模型算法的开发和训练,具有一定的研发门槛。目前国内在模型层面具备产业基础的相关企业包括:百度、商汤、云从科技等2在应用层持续推出新应用的相关企业包括:科大讯飞、金山办公、同花顺、汉王科技、拓尔思等;在底层基础设施和工具有布局的相关企业包括:寒武纪、景嘉微、海天瑞声等风险提示:市场需求变动风险,市场竞争加剧风险汤姆猫访谈纪要2/19概况12011年起,汤姆猫是最早跟玩家、用户有交互功能的虚拟IP之一,运营了11年的老产品《会说话的狗狗本》去年重新回到了加拿大等地的排行榜第一,超过了TIKTOK2海外团队不断地丰富IP角色,同时持续强化。我们除了汤姆猫、狗狗本,还有安吉拉等等6个角色,围绕这6个角色,打造的20多款游戏,累计下载已经超过了200亿次。截至去年的MAU超过4亿3经过了10多年在休闲游戏里面的深耕,我们也形成了2个具有优势的品类,一个是虚拟宠物养成;一个是跑酷类。根据APPANNIE,虚拟宠物养成,公司的市占率达到86%;跑酷,我们市占率是15%,也是全球前三4除了游戏,汤姆猫围绕系列IP角色,创造了非常多的动漫、影视作品。动漫累计播放量超过1000亿次。汤姆猫也规划了大电影内容,完成了剧本二次创作,会和华纳、索尼等好莱坞公司洽谈。公司陆续布局了线下业态。线下主题乐园、线下衍生品5公司紧跟AI技术,让汤姆猫与用户有更真实的互动。2021年我们在抖音开启了虚拟直播,去年在海外上线了智能语音机器人,实现日常生活下的语音交流和互动。游戏同时也在拓展渠道,2021年以来先后拓展了华为电视机,《汤姆猫跑酷》也是华为首款体感类游戏6去年公司和科大讯飞,也展开了战略合作,目的是实现人工智能交互、语音识别等。我们也注意到CHATGPT的技术,我们国内的团队也在和海外的团队合作,已经接入了CHATGPT模型,打造更新的产品我们是帮助ChatGPT落地非常好的场景和应用,我们现在和科大讯飞、ChatGPT的合作,是一个什么具体的合作方式?我们调用ChatGPT的成本是否有大概能量化的情况?未来通过什么商业模式去变现?未来产品推向市场的节奏?1我们一直在寻找新的领域和我们的产品能合作落地的东西。我们一直关注前沿的动态,也在关注怎么让我们的IP从会说话,变成会聊天的转变。我们原来和谷歌有很好的关系,像OPENAI推出来后,我们的海外子公司在对接。我们国内的同事已经做出来一款比较前期的应用,接的就是CHATGPT2成本来说,我们现在没有太多计较这块,还是对产品的探索,看看能不能落地、跟我们的产品相结合和融合。目前尝试下来是可行的。我们去年2月份也推出了智能机器人,在汤姆猫跑酷里面,可以互动交流,给与鼓励或者指导等。我们尝试下来以后,在某一点上,在语音和AI方面并不是我们擅长的3所以我们先和科大讯飞合作,去年4季度,我们尝试CHATGPT文字端的转换的应用。做了一些尝试后,我们在今年1月份之后,我们开始尝试设计和创造新的语音聊天的产品。我们是开放的,目前还没法确定到时候上线的确切的模式4我们目前国内团队和海外团队同时在研究怎么做商业化,今天国内的团队还在跟我探讨。我们尝试免费互动一定次数,用完后有体力值,需要等待体力值恢复,或者购买体力等。我们也在研究怎么设置付费点,付费的金额肯定要能覆盖CHATGPT的成本,初步的框架就是刚刚说的关于主业的情况,2022年受疫情和宏观经济,广告面临了压力;公司对于今年主业的展望?12022年大体的情况,国内所有的企业都会受到一些影响,我们海外从去年数据来看,美国和欧洲的市场给我们带来的增长还是比较明显的,美国有18%的增长。俄罗斯、乌克兰本来也是我们体量比较大的市场,但是去年的事情让我们受影响也比较大。比如俄罗斯,业务数据其实一直在增长,但是收入数据受到了很大的影响,因为很多企业也缩减了投放广告。我们今年也会加大地区的推广和布局,我们通过两种方式,一个是自己去推,另一个是跟当地企业合作,去扶持他们2国内来看,版号的发放有所加快,我们也拿到了版号。今年产品节奏来看,汤姆猫本身也有自己的新产品,全球的发行节奏会一直保持。国内还是会有一些不确定性,是否能慢慢恢复到以往的状态,进口版号能否放开,会影响我们业务的节奏3非汤姆猫IP,我们现在也在拿全球比较好的IP,比如索尼克。同时我们自行研发非汤姆猫的IP4另外我们线下的布局,线下乐园店,可能覆盖周边3-5KM的地区,是家长比较能接受,我们看到我们的数据比较好的,客流量基本处于饱和的状态。我们也探索到了新的模式,在江苏落地的乐园,是和政府的合作的。随着疫情完全放开,各地政策的导向都会出来。长沙等地方都在找我们公司落地线下乐园的项目5随着市场的回暖,未来3年建设200家,大部分是加盟的形式,一部分是自营的模式来推广。随着我们衍生品不断地拓展,我们通过品类筛选,去开线下衍生品的专卖店。植入衍生品的售卖6整体来看,我们觉得今年的话,没有给业务团队特别明确的业务指标。O7(汤姆猫)这边其实非常稳定,随着新业务的拓展,必定有成本的产生,我们做的是长周期的规划我们现在和ChatGPT有合作吗,合作的版本是3.5还是4.0?国内除了我们还有哪家也有合作?1目前我们接的是最新的版本,应该是3.5的版本2国内我们没有太去了解同行还有哪些接入的,应该比较少,至少上市公司层面,合作的不多如果添加聊天对话功能,是否会涉及到游戏版号的更新?1如果我们想通了,或者有很好的商业模式,我们会直接在现有版本里面做更新。同时也会去打造新的产品2这里面要做区分,如果只是纯粹的应用,语音交互的应用,从目前来看,我们的判断可能是不需要申请版号,当然目前还要求证。如果只是纯粹的语音互动,应该不会界定为游戏产品产品推出的节奏,国内和海外的节奏会是怎样?1目前我们国内和海外团队在同时推进这块业务。目前没有给出明确的要求什么时候推出,其实现在推出对我们问题不是很大,主要还是对商业化这块要做更多的探讨2O7这个团队是相对比较严谨的团队,汤姆猫这块的产品开发节奏,其实去年年底已经规划到24年年底的开发节奏。国内来说相对会更快的推出,海外O7那边会考虑全球各地区的长期运营等问题,时间上可能会相对更久会说话的汤姆猫的MAU和DAU?120多个产品,我们去年平均MAU是到4亿多2我们的头部产品,我的安吉拉、我的汤姆猫2都是在5KW以上,汤姆猫跑酷在国内非常火,如果在春节能到7-8KW微软加速ChatGPT落地2/9摘要1微软发布四款基于CHATGPT的融合应用,GPT系列商用有望提速。公司宣布高级TEAMS产品“智能回顾”功能、VIVA-SALES电邮生成功能、BING搜索扩展式聊天框、EDGE浏览器聊天和编写功能,在宣布扩大与OPENAI合作后不足一月的时间内实现初步产品落地2我们认为,这将有效提升用户在会议、电邮、信息搜索和信息提取等领域的使用体验和效率,公司将引领CHATGPT产品应用,大规模商业化落地有望提速3BING搜索&EDGE浏览器:基于CHATGPT提供智能化高效搜索,革新搜索引擎体验a新Bing主页增加扩展式的聊天框,可以以类似ChatGPT的方式回答具有大量上下文的问题bEdge浏览器新增“聊天”和“编写”功能,“聊天”功能能够总结其正在浏览的网页或文档,并以对话形式回应查询c“编写”功能可以根据少数开头的提示,帮助用户生成各种场景化个性文本dBing搜索和Edge浏览器的升级,有望提高用户处理信息的交互性和准确性,个性化呈现附有来源的最新资讯4TEAMS“智能回顾”:CHATGPT自动生成会议纪要以个性化时间线,提升线上会议体验a基于GPT系列模型,Teams高级产品“智能回顾“功能将自动生成会议记录和要点,以时间线记录每位与会者发言,帮助未能到会的用户快速查看和分享会议内容b公司表示这项服务后续将以订阅制收费,6月份每月收费$7,7月份增加至$10,AI技术进一步商业化落地5VIVASALES:帮助销售人员自动生成适用各种场景的电子邮件内容a基于生成式AI驱动经验的预览功能,VivaSales可以根据用户的选择生成场景化电邮内容,帮助销售人员更有效地与潜在客户和消费者沟通bVivaSales还可以提醒销售人员何时该跟进潜在客户或客户,并按照预设格式的生成个性化的电子邮件回复,有望大幅简化销售人员电邮处理过程,提高办公准确度和效率,优化时间分配6投资建议a建议关注iii对标微软办公:金山办公iv相关技术公司:百度、科大讯飞、云从科技、拓尔思、海天瑞声、阿里、腾讯v算力公司:海光信息、寒武纪、景嘉微、浪潮信息、中科曙光vi国内巨头合作或场景型公司:光云科技、同花顺、神思电子、宇信科技、高伟达、当虹科技、寺库、知乎、汉王科技vii机器人:三花智控、鸣志电器、绿的谐波、晶品特装、微创机器人等b风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险AI版Bing&Edge浏览器:基于ChatGPT的拓展聊天式搜索引擎1公司宣布推出AI驱动的新BING主页,增加扩展式的聊天框,可以针对用户的提问给出交互式答案a新Bing以类似ChatGPT的方式回答具有大量上下文的问题b例如,新Bing可以为用户设计旅行路线,也可以进一步回答用户更多的问题,包括策划的旅行要花多少钱,或者是否可以在行程中添加或更改某些内容2技术方面,BING搜索采用比CHATGPT更先进的GPT-3.5模型,可以获取网络最新资讯。OPENAI的CEO阿尔特曼表示,公司将部分OPENAI的GPT-3.5语言技术融入了BING,从而开发了BING的聊天式交互技能a公司Edge浏览器基于人工智能的必应搜索新增“聊天”和“编写”功能。“聊天”和“编写”被嵌入到Edge浏览器的侧边栏,“聊天”功能让用户能总结其正在浏览的网页或文档,并以对话形式回应查询,提供附有来源引用的信息b“编写”功能则充当写作助手,根据少数开头的提示,帮助用户生成从电邮到社交媒体帖子在内的文本c展望未来,我们预计AI技术在搜索引擎中的应用将快速推广落地,科技巨头纷纷跟进有望带来产业加速以及持续消息催化d微软旗下Bing搜索和Edge浏览器的升级,将为用户带来高交互式的信息搜索和提取功能,并利用GPT模型呈现个性化的最新资讯,此举将有效提升公司在搜索引擎领域的产品竞争力e据每日经济新闻报道,谷歌2月6日透露计划推出一款聊天机器人Bard,与OpenAI颇受欢迎的ChatGPT竞争,寻求在将强大的新语言人工智能引入互联网搜索业务的竞赛中收复失地Teams“智能回顾”:ChatGPT自动生成会议记录和个性化时间线1公司推出基于CHATGPT技术的高级TEAMS产品,CHATGPT可以提供会议记录自动生成、推荐任务、帮助参会者创建会议模板等帮助a基于OpenAI的GPT模型,“智能回顾“功能能够自动生成会议记录和要点,将每位发言者的贡献突出显示在整齐的主题和章节的时间轴下,同时生成个性化时间线标记以便用户快速查看讨论内容b“智慧回顾”将有效提升会议举办者、参与者和未到会者的体验和工作效率,帮助不同时区的参与者快速查看会议内容、处理和分享会议信息2TEAMS“智能回顾”功能后续将以订阅制收费,标志着CHATGPT正式开启商业化,公加速AI落地进度。微软科技官方微信公众号透露,这项高级服务将在6月份每月收费7美元,然后在7月份增加至10美元,标志着CHATGPT相关的应用正式进入商业化阶段a基于GPT技术自动生成场景化电子邮件内容2023/02/08b此外,VivaSales还可以提醒销售人员及时跟进潜在客户或客户并自动生成预设格式的电子邮件回复,包括个性化文本、下一步最佳行动,以及产品描述、建议和截止日期等细节VivaSales:基于GPT技术自动生成场景化电子邮件内容1公司推出VIVASALES基于生成式AI驱动经验的预览功能,可以根据用户需求生成场景化电邮内容,帮助销售人员更有效地与潜在客户和消费者沟通2VIVA-SALES可以为各种工作场景生成推荐的电子邮件内容,比如回复询问或创建提案、提供与收件人具体相关的数据,包括定价、促销和截止日期风险提示:AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响1经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限2行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁小冰访谈纪要2/8详细内容1技术变化:大语言模型,大量参数情况下把人类几十年在互联网上面所存在的这些数据全部都压缩到一个模型里。GPT变化在于,它以很好的逡辑把它所掌握的数据提供给你。解决了一个核心的问题,海量的信息和数据如何压缩并且再次提取。但目前还不代表通用AI的到来2CHATGPT最激动人心的地方:证明了大模型这种新的理念是可行的,新的范式突破。整个AI行业,找打了天花板向上提高的方法,未来几年时间,整个人工智能行业就会迎来一次新的创新高潮。缺点不改进:结果准确率不高,因为没更新数据。在研发WEBGPT,把它不一些及时的数据结合3由于参数量规模过大,所以它的成本也陡然上升。每一次交互成本接近人民币一毛钱,是商用的一个阻碍。GPT4在尝试更小的参数规模,戒者同样参数量实现更好的效果,算法不算力:算力必须要不断地膨胀4展望:大模型的方向,毫无疑问的将会成为未来至少三五年时间的一个主流技术方向,现在已经基本上明确AIGC,生产力工具的方向1虽然1毛钱的成本,可能非常划算的。小冰上个月月底的时候,刚刚跟NETFLIX一起推出全球第一个商真正可以达到商用化质量的动画短片,端到端全部都是由人工智能生成的2GOOGLE其实没有那么没有那么恐慌。因为并不能去取代GOOGLE的搜索业务。无论是从成本角度考量,还是从用户体验角度准确性的考量。现在的AI发展还处于一个萌芽阶段,最领先技术往往不是最能落地的,往前数一代往往是能落地的3垂直。利用精标的垂直领域的数据做好。不是就一家独大戒者几家独大,是一个百花齐放的过程4希望老黄多配合大家把它的算力尽可能地不断地去扩展。未来10年内,会努力希望算力增长去配合技术的进步。希望算力总值快速增长的情况下去追求技术突破,而不会过早地去考虑优化算法模型戒者技术范式来使它摆脱戒者降低对于算力的要求。老黄多配合大家把它的算力尽可能地不断地去扩展5大力出奇迹就好,不要想那么多精打细算6数据标注a第一个环节,以前我们每一个训练数据,我们都是要做精确的标注。而大模型的特点大力出奇迹,我把一大堆数据全都塞到大模型里面去。在这个过程里面,既不会去进行人工干预,也不可能做人工干预b第二个环节,数据的精标往往是跟模型所需要完成的仸务相关c在数据隔离这件事情还没有的时候,我们国家的这种数据标注人员实际上不光为中国提供服务,为全世界范围的提供服务。增量部分对算力不标注的需求有没有一种可能是存量的差不多训练完了,后面新增的数据不太需要有特别多的算力不数据标注?1在5年之内应该不会出现这个问题。由于大模型的新的能力天花板的打破,肯定会产生大量的各种各样的创新,这种创新将像雨后春笋一样出现。因为这个原因,所以算力的需求我觉得是会持续地增长的2数据标注也是一样的,A公司的数据标注跟B公司的数据标注肯定,戒者哪怕是不同模型的数据标注很可能会采用不同的要求,所以甚至于我们说这里面可能会有重复浪费的情况3针对模型在算力的使用上面进行优化。往往能够得到10-20个百分点可能的改善。通用性:最近实际上开始说同样的一个方法,可以同时去解决语言、语音和视觉的问题4大模型就是其中的一个代表性的一个主要的范式。大模型的训练很多都是基于多模态,就是把这种文本的,语音的,静态图像的、视频的训练数据全都放在一起的。大模型是一个很通用的东西,但你用它去最终形成什么样的东西,中国的企业很可能更了解中国用a例如,百度更懂的是中国用户的搜索习惯和他们的真实需求b认为中美从技术角度来讲是没有什么太大的差距的商业模式1目前现状:今天为止,整个全世界范围内,包括美国,还没有看到一个成功的成熟的AI的商业模式。目前人工智能创造内容的企业,它往往会创造很高的价值,但是它自己只能从这个价值里面取得很低的收入2包括整个人工智能。客单价是往往难以提高的。所有的API调用形式的,这种类型的人工智能商业模式,戒多戒少都存在着一个天然的弊端。因为没有从CONTENT的不同的价值回报中获得不同的收益3基座模型的商业模式:人工智能的底层的,我们说基座模型就是FOUNDATIONMODEL公司a如果要想很好地去攫取它的商业价值,并且让它的商业模式比较稳固,它必须要向前走一步,走到至少是端到端的环节b如果只是停留在大家可以来调用我,我来做基础服务层,水电煤这一层,我认为的它的商业模式是很难稳固的,并且它的价格提升也是会有很多困难的4要不要做通用:基座大模型一定是通用的a大家有一个基本的认识,我要去做一个足够通用的大模型。我需要投入很多钱,我会得到一个即使是我现在都看不明他到底有多大价值,多大用处的,可能还有很多新奇的用处的。得到这样一个黑盒子,对肯定是一致的b技术壁垒/扩散:通用的模型上面,各家都会有一些独特之处,例如一些新的训练方法c但是这些独特之处如果是有效的,一般也会很快的被同行业者所学习到。所以技术壁垒在这个上面不是特别高5数据的价值:行业所最珍贵的数据,其实是我们叫FEEDBACKLOOP是什么?a是在实际使用过程中,由于用户交互戒者由于客户交互,由于使用者交互所反馈给平台的。这种反馈信息是随着你的产品而获得的。搜索引擎的抓取技术是很成熟b但抓取的几乎所有的数据世界的数据,公开有机会可以获得的,任何一家公司在这上面的领先优势没有那么大c假设字节跳动的平台上面的它的用户量大,它的反馈机制,数据的回路建立得好,它的数据最大部分可能就是超过百度,甚至超过很多的,这都是可能中文在线访谈纪要2/7公司对AIGC的看法12018年的CHATGPT1.0版本,2022年的3.5版本,年底爆发关注度。技术路线上,1.0-2.0版本相比谷歌的大模型没有优势,2020年的3.0版本发生了突变,2022年STABLEDIFFUSION等软件带来热潮,叠加2022年12月CHATGPT的推出,致使23年2月当下市场对AIGC的非常关注2CHATGPT为什么在短期内能有1亿的用户数,在于人机交互上第一次做到了自然语言理解。目前AIGC以国外科技巨头引领,几个巨头的博弈会带动全球AI的发展,包括国内的一些科技公司和创业公司,因此2023年国内AI的基础设施建设会迅速提升32023年预计会发布CHATGPT4.0版本,据说其参数模型要比3.5版本大十几倍,推理能力会更强,且预计是多模态的,不仅包括文字,还包括声音、图片等内容形态4AIGC将作为中文在线非常重要的内容生产方式。每年市场产出的文字内容最多(创作门槛低),几百万的文字作品,万集的漫画等,每次内容形式的复杂度提升,都意味着创作门槛的巨大提升。新的技术发展所带来的多媒体形式的统一,会使得生产成本急剧下降,可能会改变内容产品数量级的金字塔式关系,AIGC带来内容产业的想象空间5AIGC领域,公司一直有布局,已有相关产品上线,提升创作质量和效率aAI图、AI文字转语音,将文学作品录成有声作品,做到非常自然的人声音色,大幅降低生产过程中的录制成本bAI小说创作,辅助作者,已在17k小说网上线,针对作者开放,通过简单的描述然后AI进行续写创作,让作者有更多的时间和精力放在整个作品组织构架上,提升作品质量,AI会根据作品的类别进行语言调整6公司海外业务收入占比约一半,其中互动式视觉阅读平台CHAPTERS运营情况较好,AIGC的运用可以降低美术成本,是一个非常好的应用场景,这种对话式的剧本创作,每一次对话选择都有不同的故事线,有一些重复性劳动可以用AI来进行替代,正在进行尝试和研究。公司在AI领域的合作方是澜舟科技,拥有孟子训练模型,调用了其API接口数码视讯访谈纪要2/9公司介绍1数码视讯的定位是全球领先的视频技术服务平台公司,公司于2000年成立,2年在创业板上市。一直致力于视频技术、安全加密技术、AI技术以及5G等基础技术的研发和积累。公司非常注重创新和技术研发,每年研发投入占比超过20%2研发人员在公司员工的占比也达50%。在国内各超一线、一线城市以及美国硅谷都建有研发基地。公司与电视台合作进行后期的辅助制作工作,公司的AI模型能将原始素材(公司在研究视频领域的AI技术有天然优势3自2000年开始公司就服务于电视台广电网络,储备有大量视频数据,客户需求的驱动也促使公司很早就开始了AI领域的布局42016年公司在VR和AI方面基本上是同步立项并推进相应研发工作,从最早的视频识别、后期的视频AI内容优化再到现在视频内容的AI生产,有一个进化和演变的过程。AIGC实际上是对公司AI内容生产的一种全新提法,也是面向客户的重要服务模式5现在很多平台的文字内容也都是通过AI进行辅助提升的。公司视频识别及AIGC模型能够作为短视频平台的创作工具帮助短视频的创作者开展素材生产和剪辑工作、提高生产效率,也可能在未来集成为一个2C的工具类产品。腾讯在短视频方面有其重要戓略布局(视频号),而我们在视频技术方面有很强的技术积累,与公司签订了保密合作协议6根据编导要求剪辑成短视频。比如体育赛事的进球精彩瞬间、红黄牌、越位等片段以及一些宣传物料。目前视频领域的AIGC模型还需要通过进一步的训练来提高所生产内容的品质及效率AI后期制作戒者主动创作的成本大概是怎样的情况?提高效率的同时减少了成本121年军网(8:45)的元宇宙春晚原本需要数月时间制作2使用了公司的系统后只用了两个星期的时间就完成了AIGC在降本增效方面的贡献率能否量化地用比例指标进行衡量?1首先减少了时间投入和相应的人员工时费用2以中国军网元宇宙AIGC视频平台及内容项目为例,内容制作效率的提高是在50%以上公司目前有在视频文本方面与ChatGPT戒OpenAI等AIGC模型进行接口的合作?1公司业务偏重视频领域,上述这些模型主要应用在图文领域,接入价值不大2因此目前没有考虑这一合作方向AI视频的生成方面与抖音、快手等短视频平台的合作状态如何?1公司AIGC视频应用服务的核心面向对象就是短视频平台2公司最早和腾讯签署了戓略合作协议,现阶段计划全力推进该合作方向,验证使用场景及创作者对AIGC产品的接受程度,在此基础上再去推进与抖音等其他短视频平台的合作沟通客户对AIGC的关注热度是否有提升?1整体热度都在提升,包括电视台客户、局领导等,关注度在持续提升2考虑AIGC方向考虑布局公司现在和腾讯合作的在手订单量级?1目前尚不能称为订单2AI技术及其相应产品,存在发展过程,公司最早的AI内容识别、AI内容优化,有案例AI内容生产,尚未有在手订单,目标是进行模型训练,落地到更多应用场景。公司在AI目前与电视台已实现长期合作,公司在视频平台与影视公司合作方面是否有更多的拓展?1与视频平台的合作。公司一直在大力推进,与腾讯签署保密戓略合作协议2对于影视公司,数码视讯存在4大业务板块,影视制作、投资以及发行是其中重要的业务方向,影视领域目前已有很多合作伙伴,与影视制作的后期业务进行对接,提高生产效率,缩短制作周期,目前处于积极推进和沟通状态应用领域的拓展方面还有哪些潜在的空间?1在AI领域的拓展,目前主要是AIGC2作为一家科技型的公司,公司立足于广电行业,对于内容布局一直在探索思考,AIGC会作为重要的技术去落地,以适配更多应用场景公司在AI方面布局较久,感受技术迭代的变化情况如何?1AI迭代存在较长演变,每次迭代都伴随功能提升216年早期的时候,公司注重内容识别,对于整个视频,不仁要识别画面,还要识别语音以及字幕,甚至是画面中的物品,并判断是否存在危险性戒敏感性等等。持续迭代过程中,升级到对视频的内容优化,如超分AI,将质量较低内用AI生成质量较高的内容3最后演变成目前AIGC这类更具智能的生产,目前主要作为短视频素材生成工具,未来期望实现更多高品质视频生产。持续迭代,伴随着更多功能和更多应用场景的实现如何看待公司的研发投入水平与产出成果,公司主要的竞争优势是什么?1公司的研发投入位居创业板前列,每年研发投入占比超过20%,研发人员在全公司占比约50%2公司非常注重研发,在北京、深圳、武汉、西安、成都、长沙等一线及新一线的城市,以及美国的硅谷,都设有研发基地,大量的研发投入确保公司具备长期核心竞争力公司2023年的业绩展望如何,及AIGC业务能否有所贡献?1公司2022年给出1.2亿元的净利润业绩指引2对于2023年,公司预期达到1.8亿元净利润,2023年的业绩指引增幅源于新的研发产品及新拓展的客户3AIGC是重点发展方向,目前在营收结构上没有单独统计,我们希望实现更多场景,积累更多客户,并不急于一时营收,在未来某个节点所创造的营收将会是水到渠成。公司的其他业务,如说超高清业务、安全业务、应急系统业务等,足以支撑公司达成业绩预期中外的发展路径是否相同,ChatGPT从文字交互出发,国内存在一些在语音成熟的公司,在图片、视频领域是否会相同?1发展路径应当比较一致2都会从最易实现的方向开始,视频方向会做持续布展望行业在AIGC的文字、图片、语音、视频等,哪个方面有望率先突破?国内的市场份额谁将是最大的?1文字是最快的,目前推出的CHATGPT已证明文字是当前更具智能化的一个方向。视频是最困难的,其次是图片,图片可以看作视频的一个画面2视频未来会成为最重要的部分,类比人们信息获取从文字到图片,再拓展到视频,无论是长短视频,还是与人沟通采用视频连线,都说明视频的信息承载是最多的3AI从文字起步最容易的,随着发展,最后一定是在视频领域汉王科技访谈纪要2/7近期ChatGPT比较火,公司与之有何关联?1CHATGPT是一个人机交互的语言模型,是目前NLP领域最前沿的研究成果之一,由于其高质量的对话内容响应能力2事实上相当于解锁了多样化的文本内容生成能力,目前成为AIGC里程碑式的模型或产品。CHATGPT是一个通用的大模型,而生成式模型做为一个黑匣子,仍然具有结果不可控的特点3相对而言,公司基于自身在NLP技术领域的全面性以及长期在行业端的深耕,对不同行业客户的数据特点、业务需求的理解更为深刻4在项目磨炼中,已经形成自身独有的算法模型,更能为行业客户提供满足需求、输出结果更为专业精准的专业化模型,这在前面提到的项目中已经落地并得到实践验证汉王在文本大数据业务上,主要的竞争优势?1公司曾获国家科技进步一等奖的手写识别技术、国家科技进步二等奖的OCR识别、业内领先的NLP自然语言处理等一系列领先技术支撑公司成为文本大数据领域的龙头企业,公司的满文古籍、藏文古籍、民国文献、医学文献等人文数字化业务长期处于行业龙头地位2公司在文本大数据业务上依托OCR识别、自由手写文稿识别、复杂报表识别、自然语言处理NLP、RPA机器人流程自动化等技术以”技术+产品+服务“的方式为客户提供服务3形成“技术平台+行业赛道”的业务模式,在各行业赛道中寻找数字化、智能化的落地场景,并在全国重点战略城市成立分子公司搭建大营销网络,目前在司法、档案、医疗、金融、数字人文、教育等众多领域广泛应用公司文本大数据业务技术积累,主要应用在哪些领域,未来的趋势是什么?1公司是人工智能领域的创新型企业,通过三十年的不断演进,形成业内领先的文本图像识别、自然语言处理(NLP)、生物特征识别、智能视频分析、智能人机交互等人工智能产业链关键技术a公司的文本大数据业务就是基于OCR技术、NLP技术,从文本数据的采集、结构化处理到数字化、智能化利用的大数据服务,经过多年发展已经形成较为完整的产品体系b并在司法、人文、金融、档案、政务、医疗等行业积累一大批具有粘性的优质客户群,对客户需求有深入理解,在各领域树立了具有示范作用的标杆项目2从模式上看,公司目前主要是通过嵌入式业务服务+多种AI机器人的形态,帮助客户完成业务资料数字化及业务流程的智能再造,提升公共服务的效率与服务水平3在数字中国、数字经济建设的大背景下,相关行业数字化、智能化建设的政策导向明显,公司希望以自身技术为驱动4帮助客户打通从文本信息—电子信息—文本数据—结构数据—RPA—数据智能决策(行业机器人)的模式,实现机器代替或辅助人进行相关信息数据的智能处理或决策5未来随着算力、NLP技术、大数据技术、RPA等软硬件技术的发展,AI在图像及文本数据上的智能处理将得到更广泛的应用,自动生成问答、虚拟员工、虚拟机器人等AI智能服务也将得到更多的市场认可目前公司的业务在国内的开展区域似乎集中在北京,天津,在其他区域有进展吗?1在国内TOB方面,公司通过标杆项目、设立区域中心、资源合作等方式进行业务扩张及渠道开拓,在全国主要城市设立了十余个分子公司、区域中心辐射国内重点区域市场2并通过第三方代理体系增强覆盖偏远地区,目前在北京、上海、广州、深圳、杭州、武汉、许昌等重点战略城市均布局标杆项目或区域中心3在国内TOC方面,目前公司主要通过京东、天猫、拼多多及其他平台进行线上产品销售公司之后如何进一步降本增效,提高净利率?1公司管理层会进一步加强费控管理,对一些长期亏损且前景不明的业务进行及时调整,重点优化和发展市场潜力足、前景明朗的产品和业务线条2受疫情等因素影响,2022年公司的原材料成本处于相对高位,随着库存原材料的消化、产品销售的完成及公司对供应链的调整,在成本上的控制及优化应会有所体现3为稳固市场地位,公司数字绘画部分产品在2022年的售价有所下降,加上原材料成本上升、物流成本上升等因素影响,毛利率有所下降4但是搭载数字笔芯片的新产品以及高端专业数字绘画产品的陆续上市,使公司数字绘画产品体系更加完善,市场地位更稳定5随着芯片、屏等原材料以及物流成本的回落,专业产品销售额和数量的提升,应会带动数字绘画整体业务的毛利率回升如何看待公司的研发投入水平与成果?1作为人工智能领域的创新型公司,公司一直保持较高水平的研发投入,技术领先是公司的生命线。2021年,研发投入占比为177%,研发投入占比较大2长期的研发投入为公司储备和积累了大量的先进技术,公司管理层会进一步努力经营,加快技术落地转化,通过扩大业务规模,将技术优势转化为市场规模,摊薄研发费用,提升公司的销售利润率,体现公司的技术价值3未来公司会继续保持对重点项目及前沿技术的投入,确保公司在人工智能领域的技术领先性及新产品的推出,为业务开展奠定技术储备及产品基础2022年业绩预告解读?1整体来讲,2022年的经营压力跟疫情的波动反复有较大联系。主要体现在以下两个方面:一是对公司业务开展和市场开拓的直接影响,海外数字绘画业务目前占公司业务比重较大,2020年疫情爆发刺激线下消费向线上消费加速迁移2同时在线教育的教学互动需求被激发,带动公司数字绘画业务大幅增长,之后受海外防疫政策的变化、高通胀、以及俄乌战争影响,海外数字绘画业务受到影响;同时,国内受疫情反复等影响,公司TOB部分项目无法正常实施、新项目开拓受到影响3二是疫情对产业链影响的传导导致供应链波动,公司的原材料成本处于相对高位、交付延迟等,以及为应对市场波动,稳固市场地位,部分产品降价销售,导致毛利率受到影响a虽然2022年公司面临很大压力,但是公司的战略性、必要性投入并没有停滞,继续保持较高水平的研发投入,确保公司在人工智能领域的技术领先性及新产品的推出b为之后的业务开展奠定技术储备及产品基础;就2023年来讲,目前疫情因素已经基本可控,公司对各项业务制定了较为明确的经营计划c管理层及业务团队也会继续努力、提升经营效率,克服困难,推进各项业务的顺利开展目前公司的业务在国内的开展区域似乎集中在北京,天津,在其他区域有进展吗?1在国内TOB方面,公司通过标杆项目、设立区域中心、资源合作等方式进行业务扩张及渠道开拓,在全国主要城市设立了十余个分子公司、区域中心辐射国内重点区域市场2并通过第三方代理体系增强覆盖偏远地区,目前在北京、上海、广州、深圳、杭州、武汉、许昌等重点战略城市均布局标杆项目或区域中心3在国内TOC方面,目前公司主要通过京东、天猫、拼多多及其他平台进行线上产品销售科大讯飞值得关注的AI应用方向2/5概要1讯飞有望迎来“戴维斯双击”回顾历史,讯飞过去的股价上涨周期大多由行业催化剂和公司基本面改善共振驱动2随着23年疫情好转、22年项目型延期订单确认及23年恢复增长、运营型业务持续快速增长,公司2023年营收有望恢复高增长;同时叠加人员控制和人均效益提升,公司23年净利润或将实现高增长3我们认为,在CHATGPT的火爆催化和公司基本面2023年大概率反转的双重驱动下,公司有望迎来“戴维斯双击”4鉴于疫情影响合同项目交付节奏,下调公司22-23年EPS至0.24、0.77元,预计公司24EEPS为1.0元。可比公司平均23E76.1XPE(WIND),考虑到公司在AI领域具备深厚技术积累,具备一定产业领先地位,给予公司23E80XPE,对应目标价61.60元,给予“买入”评级a2022年公司业绩和股价双触底,ChatGPT火爆助推讯飞估值提升2011年~2021年讯飞连续十一年保持营收增速在25%以上,受疫情影响,2022年营收实现同比增速0%~10%,跌至十余年来最低;扣非净利润同比下滑45%-60%b股价方面,2021年6月中旬后,“双减”政策驱动的行情结束,讯飞股价开始回调,2022年10月11日公司股价触底,期间跌幅近50%,同期中信计算机指数跌幅29%c近期ChatGPT火爆成为讯飞股价上涨的重要催化剂,23年1月16日-2月日讯飞股价上涨44%左右,同期中信一级计算机指数上涨14%左右2023年1公司业绩大概率迎来反转展望2023年,因疫情影响的项目型业务有望在2023年确认收入,同时公司运营型业务22年营收同比增长23%,23年仍有望保持快速增长态势2据董事长2023年年会演讲内容,预计23年讯飞英语听说考试、学习机、个性化手册业务营收同比增长45%、77%、38%,智医助理/开放平台/智能硬件合同毛利同比增长80%+/30%/35%3费用端,2023年公司将严控人员规模增长,更加注重人均效益提升,公司人才进入红利释放阶段。综上,我们预计,公司2023年大概率迎来收入及净利润的快速增长42023年起公司迈入利润年增速30%以上的高质量发展阶段根据董事长2023年会演讲内容,2023年起,公司战略由规模扩张阶段转向高质量发展阶段5体现在四个方面:利润实现年30%以上的增长;现金流匹配利润增长;人均效益三年内翻番;运营型业务五年内年收入达到500亿元,收入占比达到80%以上,业务毛利润达到200亿元。我们看好运营型业务助推讯飞实现长期可持续性发展回顾历史1公司股价上涨周期多由行业&公司基本面共振驱动2011年以来,公司股价历经三次上涨周期:2015年1~6月、2017年6~12月和2020年10月~2021年月2回顾历史,除2015年是整体创业板牛市外,之后讯飞的每轮股价上行背后都有公司基本面改善和AI行业催化剂的驱动3AI行业层面的催化剂成为拉动讯飞估值提升的重要驱动力,公司基本面的边际改善提升了公司EPS,两者共振驱动讯飞迎来“戴维斯双击”华泰计算机1讯飞股价涨幅155.0%,同期中信计算机指数下跌3.76%行业层面,2016年3月,GOOGLE旗下的DEEPMIND智能系统ALPHAGO对战世界围棋冠军、职业九段选手李世石,并以总比分4:1的明显优势战胜李世石22017年5月,ALPHAGO迎战世界排名第一选手柯洁再次以3:0的绝对优势获胜。ALPHAGO的接连获胜引发了资本市场对AI的热烈讨论3公司层面,2017年科大讯飞“平台+赛道”战略初具成效,2017年公司营收同比增速首次突破60%,达到64.0%,较2016年上涨了31.2PCT;扣非净利润同比增长40.7%42020年10月~2021年6月:讯飞股价涨幅99.1%,同期中信计算机指数微涨0.17%公司层面,在数十年的深耕和沉淀下,公司智慧教育业务红利开始释放,区域因材施教解决方案大规模推广,陆续在安徽省蚌埠市等地区形成标杆产品。2020年,公司教育领域营业收入同比增长67.6%,相较2019年上涨了51.5PCT5行业层面,2021年3月,教育部颁布“睡眠令”,同年7月出台“双减”政策。“双减”政策的出台使得资本助推的校外培训行业受挫,科大讯飞专注于K12校内教育业务,“双减”政策的出台对讯飞智慧教育业务形成了重大利好,也推动讯飞股价有了显着的上涨2022年1公司业绩和股价双触底业绩底:2022年营收增速跌至十余年来最低2011年~2021年科大讯飞连续十一年保持营收增速在25%以上22011年以来,科大讯飞稳扎稳打,丰富产品矩阵,强调AI的规模化应用,积极扩大市场份额,追求营收的高速增长。所以过去十一年,公司营收增速都维持了25%以上的快速增长,其中2013年和2017年分别高达59.9%和64.0%,201年增速最低(27.3%)3受疫情影响,2022年公司营收增速下滑至0%~10%,超30亿元项目延至2023年。根据公司业绩预告,2022年受新冠疫情反复等不利因素影响4预计2022年营收实现同比增速0%~10%,跌至十余年来最低;归母净利润同比下滑60%-70%;扣非净利润同比下滑45%-60%5主要原因是全国各地项目招投标延迟,尤其是在4Q有超过20个项目、超30亿元合同延期股价底12021年6月-2022年10月讯飞股价下行近50%2021年6月中旬后,“双减”政策驱动的行情结束,科大讯飞股价开始回调,2022年10月11日,公司股价触底,跌至31.10元,期间跌幅近50%,同期中信计算机指数跌幅29%。之后公司股价跟随计算机指数震荡向上2CHATGPT的火爆成为此轮讯飞上涨的行业催化剂。2022年12月2日,OPENAI历经三年研究正式推出CHATGTP。作为全新的人工智能(AI)聊天机器人,CHATGPT被认为正在“掀起新一轮AI革命”。2月1日,OPENAI官方发文称将推出CHATGPT的试点订阅计划CHATGPTPLUS,定价每月20美元3CHATGTP和大模型的火爆引发市场对人工智能的高度关注,国内资本再次热议AIGC的投资价值。202年春节后CHATGTP板块迎来“开门红”,开盘第一周CHATGTP指数上涨15.9%2023年1公司业绩大概率迎来反转2023年起讯飞将开启高质量发展新阶段2023年起,公司战略由规模扩张阶段转向高质量发展阶段。在2023年1月18日科大讯飞2023年会上,公司董事长刘庆峰提出,“依托根据地和系统性创新,2023年科大讯飞将开启高质量发展的新阶段2”同时,公司明确定义了高质量发展阶段的四个关键维度:利润、现金流、人均效益和可持续性。具体来看a利润:2023年,公司将开启利润年增长30%以上的新阶段。考核机制上从规模优先转变为效益优先,将利润指标变为考核指标的第一权重b现金流:现金流要匹配利润增长,同步良性发展c人均效益:通过人才招引和内部培养系统化提升,丰富人才梯度类型,加快高潜员工的发展,实现人均效益在三年内能够翻番,扩大员工的成长空间d可持续性:运营型根据地业务和持续流水型业务目标在5年内实现收入占比超过80%,项目型业务收入占比控制在20%以内3讯飞未来五年目标:运营型根据地和持续流水型业务直接可触达的年收入规模达500亿元。根据公司发展目标,五年内公司运营型根据地和持续流水型业务年收入达到500亿元,业务毛利润达到200亿元,夯实公司长期可持续发展的基本盘4其中,教育、消费者领域可预见收入各200亿元,医疗领域收入100亿元,智能汽车、运营商领域收入各50亿元,智慧城市和智慧金融业务收入合计50亿元2023收入端1我们预计项目型业务恢复增长,运营型业务继续保持快速增长项目型业务:2022年项目型业务受疫情影响延期,2023年有望恢复增长a2022年受新冠疫情反复等因素影响,对公司项目型业务造成较大扰动。根据公司业绩预告,22Q4超20个项目、超30亿元合同延期至2023年b据公司2023年1月30日发布的《2023年1月30日投资者关系活动记录表》,2022年公司延期项目中超过60%的项目属于教育领域,剩余40%与智慧医疗和智慧城市相关,公司预计大部分项目可在23H1招标完成c2022年公司运营型业务收入尽显韧性,2023年有望实现更快增长在疫情背景下,2022年公司运营型业务收入仍同比增长23%2根据公司2023年年会董事长演讲内容,运营型业务中教育领域占比最大,在22Q4大部分学校提前放假的背景下,22Q4运营型业务收入依然实现了同比增长13%,对冲了大项目延迟所带来的压力,成功应对了宏观环境的不确定性智慧教育1运营型业务进一步夯实,新领域布局完成迈入规模扩张期讯飞深耕智慧教育领域十余年,搭建了比较完备的产品体系2经过十多年的深耕,公司目前积累了深厚的行业KNOW-HOW和人才储备,建立了紧密的客户关系,成功搭建完备的产品体系。从场景角度来看,讯飞智慧教育提供了覆盖教、学、考、评、管的教育全场景解决方案3从商业模式来看,讯飞智慧教育形成了面向国家到省、市、县、区、学校、课堂以及个人的全方位智慧教育产品体系4从产品角度来看,随着智慧体育、智慧心育等新产品的推出,公司已经形成了从学业能力提升、到五育并举、再到底层平台的产品格局52022年,公司智慧教育运营型业务收入保持了稳健增长。同时,公司积极参与新兴业务的建设,在课后服务平台、智慧体育、智慧心育等方向进行了新产品的研发和业务拓展投入。具体来看:1)英语听说考试:英语听说是典型的GBC联动根据地业务,能够在大环境波动下体现出良好韧性6根据公司2023年年会董事长演讲内容,2022年公司英语听说业务营收同比增长35%,新增12个地市的中考和2个省市的高考,新增市场学生100%覆盖。公司预计,2023年英语听说考试业务营收有望同比增长45%学习机1学习机业务分为线上、线下两大模式。2022年整体学习机业务营收同比增长53%。线下门店开始形成持续流水,营收同比翻番2同时,学习机的因材施教独特价值进一步得到明确,受到了市场的广泛肯定。公司预计,2023年学习机营收同比增长会比2022年更快,增长目标为77%个性化学习手册1在高中个性化手册领域,2022年讯飞运营的收费学校新增300所,累计达1,400校,收入同比增长12%,学生续购率由2021年的89%提升至2022年的91%,付费转化率超过70%,成熟运营校的ARPU值同比提升了16%2公司预计,2023年新增600所学校,目标营收同比增长38%。同时,公司业务还延伸至中职教育市场,挖掘职教高考用户的需求,目前已在部分省市形成了应用示范3课后服务平台、智慧心育等新兴业务布局完成,2023年有望进入规模推广期4根据讯飞2023年年会董事长演讲内容,2022年科大讯飞积极布局课后服务平台、智慧体育和智慧心育三大新领域,目前均已初步完成前期搭建,有望在2023年进入规模推广期课后服务平台1“双减”政策聚焦学校主阵地,学校是未来重要的场所。针对“三点半”难题,科大讯飞推出课后服务平台,实现课程接入、管理及必要的资源共享。据公司《2022年10月29日投资者关系活动记录表》、《2023年1月30日投资者关系活动记录表》2从收费模式来看,目前有两种付费模式:第一,以县区为单位付费,项目建设后可形成持续稳定的运营服务收益;第二,学校付费建设管理平台,更多收益来自于学生按照课时付费3从业务进展来看,根据讯飞2023年年会董事长演讲内容,2022年公司新增占位130个区县平台,累计覆盖区县280个,形成260门课程,超过5,000所学校开课,市场份额超过50%智慧体育1讯飞智慧体育解决方案依托AI教学助手、AI测评系统、智能穿戴设备三种产品形态,覆盖日常教学、体育比赛、课后训练、国家体测、体育考试、体育教育管理等六大应用场景22022年,讯飞智慧体育解决方案支持超20项体育考试和体能训练项目结果诊断与运动姿态指导,累计开展110多万次评测指导,帮助学生运动成绩平均提升13.7%智慧心育1科大讯飞智慧心育是一款服务于中小学心理健康教育的整体解决方案,引入北京师范大学心理学部、华东师范大学上海市心理健康与危机干预重点实验室、中科院心理所专家的研究成果2讯飞智慧心育解决方案能够为学生、教师、家长、校长不同人群提供减压星球、心育资源、家庭教育指导和心育大数据服务。根据讯飞2023年年会董事长演讲内容,2022年,公司智慧心育业务已覆盖20多个省级行政区,已有学生用户70余万人,累计完成135万次心理测评3综上,2023年讯飞教育业务营收有望实现快速增长。据公司《2023年1月30日投资者关系活动记录表》:英语考试、学习机、个册2023年营收增长目标分别为45%/77%/38%新兴业务1课后服务平台在2022年属于布局期,2023年起进入课程收费阶段;智慧教育、智慧心育在2022年属于探索期,根据讯飞2023年年会董事长演讲内容,目前也已积累了上亿元商机2因此,我们预计公司智慧教育业务2023年营收有望实现快速增长智慧医疗12023年智医助理业务将保持80%以上的高速增长2022年智医助理的刚需不断显现。根据讯飞2023年会董事长演讲内容,2022年公司智医助理合同毛利增长100%,2023年仍将保持80%以上的高速增长2在全科医生助理方面,2022年科大讯飞已累计覆盖全国380个区县,累计提供AI辅诊建议次数5.3亿次,累计提供有价值的修正判断超过63万份,累计识别不合理处方数4,000万个a目前,AI辅诊推荐Top1准确率已经提升至97%,覆盖了超过2,000+种疾病。同时,AI用药审核的正确率也提升至95%,覆盖药品数量已经超过5万种b在家庭医生助理方面,公司产品广泛应用于慢病随访、通知宣教、体检预约、疫苗接种、满意度随访、疫情防控等多场景,累计服务超过10亿人次c发展智慧医疗多元业务,丰富产品矩阵。除了智医助理外,科大讯飞还孵化了智慧医院、智慧医保、安徽影像云平台等新产品,形成了非常重要的试点应用3根据讯飞医疗官微发布的2022年度报告显示,截至2022年底,公司累计向超过300家三甲医院提供智慧医院解决方案,为医生提供了1,100万次智能规划诊疗和协同办公服务a“人工智能全病案医保审核系统”目前已在吕梁市全面上线应用,常态化开展医保数据合规审核;安徽影像云平台联通了1,800多家医疗机构,提供远程影像服务450万次,存储了6,100万例影像检查数据b“一体两翼”核心技术框架推动智慧医疗不断迭代演进。为了进一步突破智慧医疗领域,科大讯飞提出“以医学知识自学习为基础底座c以诊疗推理、健康交互为两大技术”应用的医疗人工智能“体两翼”核心技术框架体系。在诊疗推理技术领域,AI用药审核能力显着提升,图神经网络的时序推理技术方案取得突破d在健康教育技术领域,基于患者画像和医疗事件图谱的多轮交互推理技术显着提升,多模态AI问诊预研取得了突破。在医学知识自学习领域,公司构建了面向医生、患者、AI的一体化医药知识体系智慧汽车1产品布局不断丰富产品布局:从语音到驾舱到音响,公司智能汽车根据地产品不断丰富。根据公司2023年1月30日投资者关系活动记录2在2019年前,公司在汽车领域的主要产品是语音交互套件,提供语音能力给汽车厂商,汽车厂商负责开发相关应用系统智能座舱1即智能座舱信息域智能控制器,具体来说,可以将域控制器理解为电脑主机,能够控制汽车上的导航、音乐等各种服务。目前,公司能够提供从软硬件一体化的控制器到相关的应用系统2根据讯飞2023年年会董事长演讲内容,2022年,讯飞智能汽车新增定点储备车企110多个,2023年公司预计新增车型超过130个。2022年新增定点储备收入达到38亿元,同比增长118%。2023年,存量定点储备项目可提供4亿元营收,新增项目则将提供3.4亿元营收智能音效1由于新能源车机械结构简单,汽车产生的噪音较传统燃油车更小,安静环境下车内人员对音响效果的敏感度和音质要求均更高。而科大讯飞将音频技术和人工智能技术相结合,显着提升了车载音响效果。讯飞智能音响一经推出,受到了市场的广泛欢迎2根据2023年1月30日投资者关系会议纪要,目前一汽、广汽、上汽等汽车厂商的多款车型已经完成定点;音效产品随着智己L7.传祺M等合作车型落地量产,预计未来会有更多的新能源车配置(来源:科大讯飞智能汽车官微)其他运型业务1运营商、智慧城市、智慧金融等业务亦实现突破1)运营商业务:由于国家管理体系对重大数据安全的要求,运营商在国计民生领域的主导地位重新增强,重回黄金时代2科大讯飞既有独特技术,又是三大运营商的战略合作伙伴,同时中国移动是公司的第一大股东,有较大的机会开拓市场3根据公司2023年1月30日投资者关系活动记录,2022年,公司累计终端用户数9,100万,日语音活跃用户数首次超千万4一老一少等运营型业务收入达到6,100万元,同比增长91%。2023年公司目标是运营商业务中的运营型业务毛利占比从2022年的32%提升至38%,运营型收入同比增长57%智慧城市12021年12月,科大讯飞中标5.5亿元的安徽省一体化平台项目,支撑数字安徽发展。目前,仅有安徽省将全省数据放在同一个一体化平台2实现了省、市、县、区、乡五级联动,大幅降低单个部门信息化服务成本,提升数据共享效率。2022年,该项目取得了较大进展,公司已将其报备国务院,有望成为政府数字化转型的标杆项目3皖事通是在项目期间打造的移动端平台。在公布的202年度政务APP排名中,皖事通排第四,仅次于个人所得税、国家反诈中心和国务院APP,服务了安徽超7,000万名老百姓智慧金融1科大讯飞的智慧金融业务主要面向银行、保险、证券等金融行业客户,为他们提出数字化管理与数字化经营的整体解决方案,提供包括AI中台、数据中台、知识中台、金融营销平台、智能客服等AI+金融应用a2021年起公司与浦发银行联合打造的“客户互动服务实时感知与智能分析平台”荣获“亚洲银行家最佳会话式人工智能项目”称号,在金融行业客户服务领域中率先落地基于人工智能技术的实时风控b综上,2022年公司运营型根据地和持续流水型业务呈现良好态势,2023年公司预期各子领域仍能保持快速增长,拉动科大讯飞整体业务向好c2023年费用端:注重人均效益,人才红利开始释放2023年公司更加注重人均效益,人才进入红利释放阶段2根据讯飞2023年会董事长演讲内容,202年科大讯飞期间费用增长9亿元,其中70%左右是人员费用,这些人员大多用在运营型根据地开拓和新产品研发上,这些投入在2022年并没有能够形成较大的当期收益a根据公司2023年1月30日投资者关系活动记录,科大讯飞预计采取两方面措施为了控制人员增长、提升人均效益:控制人员数量b据Wind数据,2021年公司总员工数14,307人,同比增加3,301人。我们认为,随着新员工经过了1~2年的训练,有望在2023年逐步贡献增量价值c此外,据公司《2023年1月30日投资者关系活动记录表》,2023年公司除了应届毕业生和高端人才外,公司没有其他大型招聘计划,目标做到人员总数同比基本不增长3提高人均效益。为了能够提高人均效益,科大讯飞提出了“零基预算”战略。“零基预算”战略是指所有部门压缩10%的编制,90%的员工完成以前100%的工作量,公司将剩余10%的人员重新分配到新的战略方向上。通过内部组织的效能优化、现有员工能力的提升以及前后端拉齐,公司有望实现人均效益的增长4综上,我们预计,讯飞2023年收入端有望实现快速增长,费用端有望得到控制,从而带动净利润同比实现高速增长盈利预测和估值收入及盈利能力预测智慧教育业务1主要面向G/B/C三类客户提供产品及服务:G端业务主要以市县区等区域建设为主体,涵盖面向区域内所有学校及用户的因材施教整体解决方案等2B端业务主要以学校建设为主体,包括校内大数据精准教学、英语听说考试等;C端业务主要以家长用户群自主购买为主,包括人工智能学习机、个性化学习手册等产品3智慧教育业务2021年收入同比增速为48.85%,增速较快,主因公司区域级因材施教解决方案规模化扩张加速。考虑到:公司因材施教解决方案持续复制推广,G端业务收入有望持续高增长4据公司官网,2022年B端业务中的考试业务营收同增35%、新增落地12地市中考和2省市高考,B端客户持续开拓;据公司官网,2022年C端业务中的学习机产品营收同增53%,个性化学习手册业务营收同增12%、续费率同增2PCT至91%,C端产品持续放量5据公司2022年业绩预告,受疫情反复影响,2022年公司部分合同项目延期,收入确认滞后。考虑到上述因素,结合公司对23年收入预测,我们预计公司2022-2024年智慧教育业务营收增速分别为5.00%、40.00%、35.00%智慧城市1公司智慧城市业务以“城市超脑”为核心,构建新型智慧城市的数据中台、智慧中台和业务中台。2021年智慧城市业务营收增速为29.62%2据公司2021年报,科大讯飞“城市超脑”业务已应用于安徽铜陵、宣城、芜湖、合肥、亳州等地,并在天津、山东聊城、吉林长春、河南漯河、陕西铜川、内蒙乌海等国内多个城市落地3此外,据中国政府采购网,2022年12月26日公司全资子公司讯飞智元以5.5亿中标安徽省“全省一体化数据基础平台”项目4我们认为,公司智慧城市业务在全国多地持续推广,持续拿下大额订单,有望形成良好示范效应,或将带来智慧城市业务营收较快增长5此外,考虑到疫情对公司2022年合同项目交付的影响,预计2022年公司智慧城市业务营收增速下行,随着疫情好转,2023年营收增速有望上行6因此,我们预计公司2022-2024年智慧城市业务营收同比增速分别为4.00%、22.00%、20.00%开放平台及消费者业务1讯飞人工智能开放平台是基于人工智能技术与大数据运营能力建设的人工智能技术与生态服务平台,具体形态包括讯飞AI营销平台、讯飞智能工业平台等能力平台等。在消费者领域,公司围绕AI+办公场景,主要提供智能办公本、录音笔、讯飞听见APP等产品22021年公司开放平台及消费者业务营收同比增速为52.19%,增速较快,主因:开放平台下游场景持续拓宽,AI营销业务2021年营收同比增长55.55%3智能硬件产品线持续拓宽,2021年发布二代智能办公本X2,2021年消费类硬件销量同比增长140%智慧金融1公司智慧金融业务主要为银行、保险、证券等金融行业客户提供信息化解决方案,2021年营收1.97亿元,同增33.82%2我们认为,随着公司智慧金融业务持续提升在区域性银行等金融客户中的渗透率,有望实现营收较快增长。此外,考虑到疫情对公司2022年合同项目交付的影响,预计202年该业务营收增速下行,随着疫情好转,2023年营收增速有望上行3我们预计2022-2024年公司智慧金融业务营收增速分别为15.00%、25.00%、25.00%其他业务1公司其他业务主要包括正在培育中的一些新应用场景业务,如2019年公司其他业务包括了智慧医疗业务,随着业务成熟,2020年智慧医疗业务单独披露2因此,考虑到业务体量较小、公司持续加大新产品/技术投入,我们预计2022-2024年该业务营收同比增速均为5%毛利率1考虑到公司未披露分业务毛利率,因此我们只对公司整体业务毛利率进行假设。公司2019-2021年毛利率分别为46.02%、45.12%、41.13%,2021年毛利率有所下滑,预计主因a智慧教育业务中,学习机等硬件产品收入占比提升b智慧城市业务中,公司总包集成等信息工程业务收入占比提升c根据地业务人员投入加大,21年人员规模增长3,301人,部分业务营业成本上升2展望未来,我们认为公司过去战略投入红利或将逐步显现,高质量发展目标下毛利率有望保持小幅上升趋势,预计2022-2024年公司毛利率分别为41.20%、41.50%、41.80%费用率预测销售费用率1公司销售费用主要包括职工薪酬、广告宣传费、外包服务费等。2019-2021年销售费用率分别为17.66%、16.00%、14.70%,销售费用率呈下降趋势,主因公司业务的规模效应初步显现,营业收入增速超过销售费用增速2我们认为,公司作为国内人工智能龙头企业,深耕行业数字化十多年,具备一定技术壁垒和品牌优势,规模效应下销售费用率有望保持稳中有降3此外,考虑到2022年受疫情影响,公司部分合同项目延期,收入确认延后,但销售成本前置,故2022年公司销售费用率或将有所提升4基于此,我们预计2022-2024年公司销售费用率为15.00%、15.00%、14.70%管理费用率1公司管理费用主要由职工薪酬、折旧费、租赁费等费用组成。2019-2021年管理费用率分别为7.01%、6.58%、6.02%,总体呈持续下行趋势2我们认为,随着“零基预算”战略的推动,公司管理费用率将进一步得到控制,预计2022-2023年公司管理费用率分别为6.00%、6.00%、5.50%研发费用率12019-2021年研发费用率分别为16.27%、16.98%、15.45%,研发费用率相对稳定。公司的研发费用主要由职工薪酬、无形资产摊销、折旧费等组成22020年公司研发费用率同比上行,主因是公司在运营型根据地业务上大规模投入,持续加大新产品研发力度3据公司2022年业绩预告,2022年公司加大了在教育、医疗等业务领域的研发力度,新增投入约8亿元。基于此,我们预计202年公司研发费用率或将上行4但考虑到随着公司营收恢复较快增长,我们认为,2023年开始公司研发费用率或将转为下行。因此,我们预计2022-2024年公司研发费用率分别为18.50%、16.00%、15.70%估值1采用相对PE估值法,给予公司目标价61.60元综上,预计公司2022-2024年EPS分别为0.24.0.77.1.06元。选取国内AI行业上市公司虹软科技、恒生电子、四维图新、格灵深瞳作为可比公司2采用PE估值法,可比公司平均2023E76.1XPE,考虑到讯飞在AI领域具备深厚技术积累,具备一定产业领先地位,给予公司23E80XPE,对应目标价61.60元,给予“买入”评级风险提示1智慧教育业务拓展低于预期。智慧教育业务已是公司第一大主营业务,若公司区域级因材施教项目向其他区域复制推广不及预期,以及学习机销量低于预期,将对公司整体营收产生负面影响2智能硬件销量低于预期。智能硬件是公司C端市场重要业务,若智能硬件销量低于预期,将对公司营收产生负面影响同花顺AI应用方向2/5概要1AI领域积累十余年,AI商业化落地或加速公司在AI领域具备十余年的积累,形成了涵盖自然语言处理、语音识别、文字处理、图像处理在内的全方位AI技术布局,并以此为依托打造了涵盖面向企业及个人用户,金融、医疗、法律等多行业的产品及解决方案2我们认为公司凭借AI领域的技术、业务、场景积累,有望实现AI技术商业化的加速落地3多维度技术+产品布局,AI应用落地实践经验丰富公司拥有丰富的AI技术积累,包括自然语言处理、图像处理、文字处理技术方面形成了系列的AI能力a公司积极运用文字、语音、视频等多维度的AI能力,不断改善用户体验。b从产品角度看,通过同花顺AI开放平台向个体客户提供智能语音、智能客服、智能外呼机器人等服务,并形成了文字识别、AI理财师、企洞察等产品c形成了多种技术类型,多种行业领域,多种目标用户的完整产品线。公司通过全方位的AI技术及产品布局,积累了丰富的AI应用落地经验d具备良好用户基础+多个内容生成应用场景,商业化落地基础良好AI迭代需要大量的数据训练,用户则是数据的重要来源之一e公司在多年的发展中通过金融信息服务业务积累了良好的用户基础,截至22H1末同花顺金融服务网注册用户约6亿人,每周活跃用户数约1,927万人4我们认为用户既是推动AI落地的重要依托,也是提升数据质量,推动AI持续迭代的关键力量a此外,丰富的应用场景是新技术商业化落地的重要条件,而公司在内容生成相关领域,拥有辅助撰写分析报告、智能问答、智能客服、企业舆情分析报告生成等特色功能,具备丰富的内容生成落地场景b我们认为公司拥有大量用户及内容生成场景,具备良好的AI技术商业化落地基础c金融行业知识+多行业AI落地实践经验,或推动AI商业化落地加速公司深耕金融领域,垂直行业应用或进一步突破5我们认为专业知识积累或将成为CHATGPT为代表的AI技术突破垂直行业应用的关键因素,公司深耕金融信息服务行业近30年,在金融行业积累大量KNOW-HOW,有望进一步提升AI技术在垂直行业应用深度6此外,公司积极探索AI技术的多行业应用,除金融外覆盖高校、企业、科研院所、政府部门、医院、通信运营商等领域。我们认为公司有望凭借良好的场景基础,推动AI技术的多场景落地同花顺1AI领域技术及落地经验积累深厚深耕十余年,技术积累深厚十余年积累,AI领域积累深厚。公司自2009年推出I问财以来,AI领域已有十余年积累。大致可分为三大时间段a萌芽期:2009年,定位于金融垂直搜索引擎并提供专业股票信息搜索服务的i问财成立b基于此,同花顺在2012年上线了问答功能,i问财也从金融垂直领域拓展出股票、基金、债券、保险、百科、法律法规等领域c技术突破:2015年公司自主研发语音识别,为语音应用推广打下良好基础;应用加速落地:公司不断丰富AI产品线,推出包括全领域智能语音助理、智能投顾、智能外呼、智能质检、智能客服、智能转写等产品2拥有丰富的AI技术积累。近年来公司在研发方面投入逐年递增。研发人员从2015年的836人提升至2021年的291人,研发费用2013-2021的CAGR高达33.87%a在自然语言处理方面,同花顺布局语音产品十余年,深耕并优化语音技术,具有ASR自动语音识别技术、语音合成技术、NLP自然语言处理技术b其研究团队的研发范围覆盖中英文语音识别、语音合成、声纹识别、情感计算等基础研究方向,具有先进的降噪算法模型和语音信号处理技术c在图像处理技术方面,同花顺拥有智能人脸识别和活体检测技术、身份验证+OCR技术、智能质检技术d在文字处理方面,同花顺掌握知识图谱、机器阅读理解和智能审核技术、NLU及大数据分析技术、文档解析技术、关键信息提取技术、知识关联和知识校验技术3多维度技术+产品布局,AI应用落地实践经验丰富多维度AI技术优化产品,改善用户体验a公司积极推进AI的应用,通过文字、语音、视频等多维度的AI能力运用,不断改善用户体验。同花顺AI开放平台主要面向个体客户提供智能语音、智能客服、智能外呼机器人等服务b文字识别产品基于金融领域领先的深度学习技术和海量金融数据,可提供身份证照识别、表格票据识别等功能cAI理财师依托大数据、人工智能等金融科技技术,融合专业投研能力的覆盖财富管理全流程的理财师智能营销工具。企洞察app企业版是融合了智能搜索、标签画像、产业链分析和风险监控等应用i证券预警系统则能够实现舆情监控、风险追踪、企业云等功能。公司的AI技术布局涵盖文字,语音,视频等多个维度,并且通过功能迭代,不断打磨AI技术能力ii已实现AI产品落地,形成丰富的产品布局。同花顺的人工智能产品覆盖语音、图像、自然语言等多种技术类型;以及覆盖金融、医疗、法律等多行业的解决方案iii分用户来看,同花顺目前已经开发了针对上市公司、中小企业、政务机关、医疗机构、金融机构、基金经理、理财咨询师、个人等多元主体的全方位AI产品布局iv拥有包括上市公司路演平台、智能电话机、AI内镜助手、企洞察app、文字识别产品、证券预警系统、AI智能图像处理等全方位产品d内容生成彰显商业化潜力,良好基础助技术加速落地数据质量重要性提升,内容生成彰显商业化潜力RLHF打开新方向,数据质量重要性提升iChatGPT发布于2022年11月30日,相比以往的AI,展现了更自然更有逻辑的对话能力,带动AI行业关注度进一步提升ii从技术原理看,ChatGPT模型相较于此前的GPT3模型,关键差异在于引入人类反馈强化学习技术(RLHF),能够在与人类标注者互动时通过人类的反馈进行强化学习e人类标注者可对初始模型生成的结果进行修改、比较和排序,帮助模型进行训练。从参数量看,GPT1/GPT2/GPT3/ChatGPT的参数量分别为1.17亿/15亿/1,750亿/13亿。我们认为RLHF打开模型迭代新方向,数据质量的重要性进一步提升iChatGPT用户突增彰显商业化潜力,内容生成或成ChatGPT重要应用。据各公司官网,ChatGPT从0到100万用户数仅花费5天,速度远超其他平台ii从活跃用户角度,据Similarweb,2023年1月期间,ChatGPT平均每天约有1,300万独立访客,超出22年12月一倍4用户数量的快速扩大反映了CHATGPT具备较强的商业化潜力。从具体应用领域来看,CHATGPT是专为对话任务设计的模型a作为AI内容生成器,能够根据既有的文字、图像、音频创作新的内容,从而大幅提高创作效率,为消费者提供个性化的内容,甚至打造丰富的内容生态,内容生成为ChatGPT当前重要的应用场景b同花顺具备良好用户+场景+业务基础,AI商业化落地有望加速具备良好用户基础+多个内容生成应用场景,商业化落地基础良好同花顺具备良好用户基础cAI迭代的需要大量的数据训练,ChatGPT通过RLHF方式训练,则需要更高质量的数据,由此可见在AI发展的过程中,质量高、数量大的数据能够为AI迭代打下良好的基础,用户则是数据的重要来源之一i公司在多年的发展中通过金融信息服务业务积累了良好的用户基础。据公司公告,截至22年6月30日,同花顺金融服务网注册用户约6亿人;ii每日使用同花顺网上行情免费客户端的人数平均约为1,452万人,每周活跃用户数约为1,927万人iii公司拥有良好的用户基础,大量用户一方面有助于形成庞大数据积累,另一方面在与用户交互的过程中,能够持续收到来自用户的反馈,有助于推动产品的迭代iv我们认为公司在网站端、移动端积累的大量用户,既是推动AI落地的重要依托,也是提升数据质量,推动AI持续迭代的关键力量d业务涉及内容生成等多个环节,同花顺具备丰富落地场景。丰富的应用场景是新技术商业化落地的重要条件e以ChatGPT为例,ChatGPT具备较强的对话能力,因此在搜索引擎,邮件撰写等内容生成相关领域首先得到应用,商业化也有望率先于内容生成领域落地。同花顺同样在内容生成领域具备丰富的应用场景i如公司通过标签标记文章句式主干,结合AI技术自动生成金融类文本内容,辅助机构撰写分析报告;公司凭借自然语言技术生成语音资讯,向互联网用户提供智能问答、智能客服等服务ii并且通过机器学习不断总结经验,自动更新维护;此外公司还能够一键生成企业关系图谱、企业财务数据可视化图表、企业舆情分析报告、客户画像、晨报推送文章等多元化的内容,具备丰富的内容生成落地场景iii金融行业知识+多行业AI落地实践经验,或推动AI商业化落地加速深耕金融领域,垂直行业应用或进一步突破iv当前ChatGPT为代表的AI技术在通用领域展现了较强的能力,但距专业性较强的领域展开应用仍有一定的差距,我们认为专业知识积累或将成为突破垂直行业应用的关键因素5公司深耕金融信息服务行业近30年,拥有丰富的金融数据资源和形式多样、品种丰富的产品及服务,现有业务平台覆盖了证券市场中不同类型的客户群体,机构客户方面覆盖面广,其中证券公司覆盖率超90%a个人用户方面同样有庞大的客户基础。我们认为公司在金融行业积累的Know-how,有望进一步提升AI技术在垂直行业应用深度b公司触及多个行业场景,有望凭借良好的场景基础,推动AI技术的多场景落地风险提示1市场交易量不及预期。公司的业务与市场景气度存在一定相关性,若市场交易量不及预期,可能导致下游需求不及预期,影响收入及业绩增长节奏2技术落地不及预期。若AI技术落地不及预期,可能导致公司的相关业务增长不及预期

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

碳中和
已认证
内容提供者

碳中和

确认删除?
回到顶部
微信客服
  • 管理员微信
QQ客服
  • QQ客服点击这里给我发消息
客服邮箱