电力人工智能多模态大模型创新技术与应用报告人:王小华教授西安交通大学电气工程学院2025年2月1、研究背景2、关键技术3、应用案例4、未来展望目录01研究背景3/3背景1——人工智能的概念及发展人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;其在历史上经过多个发展时期,形成了不同的技术流派;深度学习是目前主流。1980s-2000s早期统计学习时期依赖统计学和人工设计特征构造算法;代表算法:支持向量机(SVM)决策树朴素贝叶斯算法2010s-2018s早期神经网络时期神经网络在多个领域取得初步应用;代表算法:卷积神经网络循环神经网络图神经网络1970s中期知识期聚焦知识工程与专家系统构建,通过人工整理知识库驱动决策,受限于知识获取成本与规模瓶颈。1950s—1970s推理期以符号逻辑为核心,依赖人工规则与推理系统(如专家系统),强解释性但泛化能力弱。2000s-2010s集成方法时期通过模型组合提升预测精度;代表算法:随机森林梯度提升决策树2018s-现在大模型时期基于海量数据与大规模预训练;代表算法:DeepSeek系列Qwen系列GPT系列神经网络深度学习机器学习人工智能人工智能领域迭代迅速、多种技术流派蓬勃发展,在多个领域已有广泛应用。4/37在人工智能领域,数据、算力与算法构成发展基石——数据驱动模型训练,算力支撑复杂计算,算法优化技术路径,三者协同推动人工智能向更高阶形态演进。人工搜集、标注图像分类英伟达GPU谷歌TPUAMD芯片CNNRNNLSTM有监督数据目标检测芯片单任务模型成本高昂、扩展性差华为异腾海光DCU寒武纪MLUSVM决策树GNN背景1——人工智能的概念及发展数据算力算法PyTorchTensorFlowMindScope训练算法多维并行算法状态监测、任务调度高效互联通讯:NVLINK、HCCL(华为)英伟达仍然是最主流的算力平台;国产算力平台快速崛起,生态逐渐成熟。语言通用模型:DeepSeek-R1多模态通用模型:Qwen2-VL通用模型是当下研究热点与未来趋势;研究高效训练算法具有重要创新意义。如何提高数据的规模与质量是当前人工智能领域的关键问题。利用模型、仿真生成前沿探素阶段底层计算库:CUDA、CANN(华为)有监督微调互联网爬取、规模大无需人类专家标注LLM预训练图像生成集群虚拟现实自动驾驶生态强化学习对比学习无监督预训练无监督数据通用模型合成数据等等5/37早期的深度学习受限于计算能力和数据规模,难以发挥优势。随后多层感知机与卷积神经网络结合反向传播算法,显著提升了模型的学习能力。随后,基于注意力机制的Transformer架构改变了自然语言处理的范式,使大规模预训练成为可能。近年来,大模型凭借超大规模参数和海量数据学习,在多模态学习、推理和通用人工智能方向取得重要进展,为人工智能的发展开启了新的阶段。注意力机制opueweeDcorBaDesdrlibkDeccorlock二FoilonEmbslengWcan序列处理高效并行多模态融合FFINLsyerNomMankdSefAtentonLayeNom模态扩展背景1——人工智能的概念及发展能力扩展检索增强工具学习Alagenti金融大模型,经典神经网络Transformer架构大模型图像/视频音频多层感知机卷积神经网络电力大模型医疗大模型_.大规模基础模型行业应用模态扩展6/37pm大模型井喷式发展自从ChatGPT在2022年问世以来,全球大模型发展迅速,百种大模型竞相发布,推动性能、规模和应用的全面突破,成为科技进步的重要动力源。背景2——人工智能大模型引领新一轮科技革命AUaMASChafGPTGBard些PanGu-22023GPT4多模态运维安全助手行业应用赋能层甲对话推荐基科学元宇宙基础算法平台层自然语言处理开发平台算法框架9-122024多模态电力设备状态感知助手习Nemoron4-340BALama3.1405BClaude3.5SonnetGrok-2DepSeck-v3lCludewithcompuleruseGFLANnpurYuanL0UniPerceivcrUni-Pereivar-MoEAlphaCodeAl主播小雨HTVII机州新国联2024.210eT5mT5201920202021GPF3⑤Codex一1-8MistralSmall3o3-miniDeepResearchQwem2.5-MaxJanus-ProOperatorStcp-loVisionDeepSek-RI开源社区大模型测评疗市搜索曲遥感计算机视觉LaMDAGBLOOMmTOOGalaticaUni-PerceiverV2底层服务支撑层回芯片地数据服务2phi-314BALama3-70B采Cauks30pmXGGeminil.sS...