王吉伟大数据百家讲坛第135期2025.03.29王吉伟,《一本书读懂AIAgent:技术、应用与商业》作者,AIGC&超自动化分析师,知名科技博客王吉伟频道创始人。多年来持续关注互联网+、IoT、产业互联网、产业升级及数字化转型,专注业务流程、人工智能、超自动化与RPA,致力于探索IOT时代产业升级新机会,为企业经营和创业创新提供前沿技术、商业模式及方法论的解读与分享。目前重点观察与研究AIGC、AIAgent及超自动化在各行业的落地应用与创业创新。已撰写各类文章上千篇,作品见诸内容平台、学术网站及杂志。前言:什么是AIAgentDeepSeek等推理模型对AIAgent的影响Manus通用智能体带来的行业启示AIAgent行业现状AIAgent如何影响企业经营前言:什么是AIAgent2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名为《LLMPoweredAutonomousAgents》的博文,详细介绍基于LLM的AIAgent,给出了AIAgent的理想技术架构。关于AIAgent(智能体)的概念很多,很多组织都给出了定义l业务角度:AIAgent是完全自主的系统,可以在较长时间内独立运行,使用各种工具来完成复杂的任务。lIBM:AIAgent是指能够通过设计其工作流程并利用可用工具代表用户或其他系统自主执行任务的系统或程序。lSalesforce:AIAgent是一种人工智能(AI)系统,无需人工干预即可理解和响应客户查询。lZapier:AIAgent是可以在环境中自主操作的实体。它可以从周围环境中获取信息,根据这些数据做出决策,并采取行动来改变这些环境-物理、数字或混合环境。lAnthropic:Agent是LLM动态指导自己的流程和工具使用的系统,保持对如何完成任务的控制。详见图书第2.2.3小节今天我们所说的主要是基于大语言模型的AIAgent(LLMbasedAgent),其最简单的表达式如下:感知:AIAgent从环境中收集信息并从中提取相关知识的能力。规划:AIAgent为了某一目标而做出决策的过程。行动:AI基于环境和规划做出的动作基于大语言模型的AIAgentPPA:感知(Perce-ption)→规划(Planning)→行动(Action)由复旦大学NLP团队提出的AIAgent定义已经得到产学研等各界的认可。AIAgent是一种能够感知环境、进行决策和执行动作的智能实体。详见图书第2.2.2小节基于大语言模型的AIAgent(LLMBasedAgent)任务型对话Agent开放域对话Agent知识问答Agent……对话型Agent个人助理Agent工作助理Agent教育助理Agent……智能助理Agent商品推荐Agent内容推荐Agent社交推荐Agent……推荐类Agent更多类型Agent参考图书第1.3节PPA表达式看着简单,实则包括万象:感知:视觉、听觉、嗅觉、味觉、触觉、平衡感……规划:目标设定、信息收集、问题分析、方案生成、决策制定、资源分配……行动:利用技术工具、合作与沟通、创新思维、分步执行、适应性行动……感知、规划与行动的每一个元素与维度,对应于智能体都是具体的应用场景,这些元素、维度与场景都可以无限的细分与挖掘。每一个元素、维度与场景的实现都会用到相应的技术、工具与资源,会催生出大量的技术、产品、解决方案与响应的企业,产业链上各个玩家均能受益。2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名为《LLMPoweredAutonomousAgents》的博文,详细介绍基于LLM的AIAgent,给出了AIAgent的理想技术架构。关于AIAgent(智能体)的概念很多,很多组织都给出了定义l业务角度:AIAgent是完全自主的系统,可以在较长时间内独立运行,使用各种工具来完成复杂的任务。lIBM:AIAgent是指能够通过设计其工作流程并利用可用工具代表用户或其他系统自主执行任务的系统或程序。lSalesforce:AIAgent是一种人工智能(AI)系统,无需人工干预即可理解和响应客户查询。lZapier:AIAgent是可以在环境中自主操作的实体。它可以从周围环境中获取信息,根据这些数据做出决策,并采取行动来改变这些环境-物理、数字或混合环境。lAnthropic:Agent是LLM动态指导自己的流程和工具使用的系统,保持对如何完成任务的控制。详见图书第2.2.3小节大模型聚焦语言处理,以文本交互被动响应指令,应用于内容生成等场景;AIAgent以LLM为核心,具备多模态交互和自主执行能力,可完成跨场景复杂任务。还有很多人在问,AIAgent与大模型...