大模型时代的“APP”,探索新一代人机交互及协作范式2024中国AIAgent行业研究报告注:AIGC生成内容亦对本报告有贡献CONTENTS目录Part01前世今生:科幻憧憬、学术概念与商业尝试Part02奇点已至:让每个人掌握AI的力量Part04时代先驱:当下商业实践值得关注的里程碑Part05潜力无限:来自于数据、算法、算力的飞轮效应Part03百家争鸣:属于大模型时代的APP繁荣AIAgent的发展历程梳理:大模型赋予了AIAgent核心改变Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在人工智能领域,这一术语被赋予了一层新的含义:具有自主性、反应性、交互性等特征的智能“代理”。大型语言模型(LLMs)的出现为智能代理的进一步发展带来了希望。基于符号规则基于统计学习基于深度学习基于大模型LLM给AIAgent底层提供了一个突破性技术方案:LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让Agent具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的Agent成为可能LLM的框架优势:过去等强化学习基于深度学习框架可让Agent学到技能,但Agent的泛化性较差,往往用于非常窄的特定领域,例如用在游戏或低维层面的控制或计划,标志性应用是围棋领域的AlphaGo。•长期以来,研究者们一直在追求与人类相当、乃至超越人类水平的通用人工智能(ArtificialGeneralIntelligence,AGI)。•在1950年代,AlanTuring就将「智能」的概念扩展到了人工实体,并提出了著名的图灵测试。这些人工智能实体通常被称为——Agent(代理*)过往的工作主要集中在增强代理的特定能力,如符号推理或对特定任务的掌握(国际象棋、围棋等)。这些研究更加注重算法设计和训练策略,而忽视了模型固有的通用能力的发展,如知识记忆、长期规划、有效泛化和高效互动等。事实证明,增强模型固有能力是推动智能代理进一步发展的关键因素。*Agent术语的中文译名并未形成共识,有学者将其翻译为智能体、行为体、代理或智能代理,目前行业出现的“代理”和“智能代理”均指代Agent,后由于2023年OpenAI引爆AIGC领域,一般称为AIAgent。过往的AIAgent类型:➢符号型智能体:采用逻辑规则和符号表示来封装知识和促进推理过程,如1980年前后,出现的医学诊断专家系统,模拟心理治疗程序等;➢反映型智能体:关注智能体与其环境之间的交互,强调快速和实时响应,缺乏复杂缺乏复杂决策和规划能力;➢基于强化学习的智体题:关注如何让智能体通过与环境的交互进行学习。➢基于迁移学习和元学习的智能体:使智能体从少量样本中迅速推理出执行任务的最优策略。AIAgent的发展历程简述数据来源:公开资料,专家访谈,甲子光年智库整理www.jazzyear.comLLM是Agent能力的增效器,交互协作程度是Agent能力的扩展器大模型时代的AIAgentLLM(规划+记忆+工具+行动)提升AIAgent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验。LLM是核心控制器,构建核心能力核心特征AIAgent记忆能力行动能力工具能力规划能力人类用户通过用户接口、命令指示等方式与Agent形成交互,是Agent的监督者、合作者和决策者外界环境Agent所处的环境(可能包括虚拟及物理世界),外界环境可以与Agent形成交互Agents其他Agent,多Agent可以形成协作,结合相关任务结果形成群体智能系统开发者Agent的开发者,对Agent的相关能力,设计Agent的相关组件能力人机交互设计开发感知反馈群体协作架构解析当下大模型的参数量提升AIAgent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验,是当下Agent的构建关键。Agent基于LLM的组件,和交互两个层面数据来源:公开资料,专家访谈,甲子光年智库整理www.jazzyear.com当下的AIAgent可以看作LLM技术下Prompt工程的进化AIAgent是Prompt工程的一种升级,Agent的核心在于自主性的增强,可有效完成某一个工作点或工作单元,尽量减少人的干预;评价一个AIAgent的核心逻辑:在流程上的节点上完成了什么程度的自动化...
发表评论取消回复