AgentVerse: 多智体协同和智体涌现行为

23年8月份来自清华大学、北邮和腾讯的论文“AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents“。

大语言模型(LLM)使自主智体已经有了重大改进,能够跨广泛的任务进行泛化。然而,在现实世界的场景中,通常需要个人之间的合作来提高任务完成的效率和有效性。因此,受人群动力学的启发,作者提出一个多智体框架AGENTVERSE,协作和动态地调整其组成,作为一个“大于各部分之和”的系统。实验表明,AGENTVERSE框架可以有效地部署多智体组,比单智体更强大。此外,深入研究在协作任务完成过程中群体内个体智体之间社会行为的出现。鉴于这些行为,讨论了一些可能的策略,用积极的策略并减轻消极的策略,提高多智体组的协作潜力。

AGENTVERSE将智体组问题解决过程分为四个关键阶段,如图所示: (1)专家招聘(expert recruitment) - 招聘模块根据当前解决问题的进度调整专家智体。(2)协作决策(cooperative decision- making) - 招募的智体参与协作讨论,旨在制定解决所提出的问题的策略。一旦达成共识,就会提出拟议的动作。(3) 动作执行 (action execution)- 智体与环境交互以执行动作。(4) 评估(evaluation) - 执行动作后,该模块评估当前状态与期望目标(goal)之间的差异。如果当前状态达不到预期,则会向第一阶段发送反馈奖励,并动态调整智体组的组成,促进下一轮的协作。

添加图片注释,不超过 140 字(可选)

相关工作

创建现实世界环境中智能运行的自主智体,一直是AI历史上的一个持续目标(Wooldridge & Jennings 1995; Minsky 1988; Bubeck2023)。最近LLM(Touvron2023a; OpenAI2023)为实现这一目标开辟了更多新的机会。这些LLM具有非凡的理解、推理和生成能力,允许自主智体(Richards2023; Nakajima2023; Reworkd2023),作为处理日益复杂场景的骨干。然而,即使这些自主智体已经表现出相当大的力量,仍然缺乏某些基本的类人认知能力。因此,一些研究设计了赋予智体反射的外部机制(Yao2023b; Shinn2023)、任务分解(Wei2022b; Yao2023a)和工具利用/创建(Schick2023; Qin2023a/b; Qian2023b)能力。这些进步使当前的自主智体更接近实现通用AI。

在人类社会中,由个体组成的组织良好群体通常可以协作处理更大的工作量,并以更高的效率和效果完成复杂的任务。在人工智能领域,研究人员从人类社会中汲取灵感,旨在通过研究多智体系统(MAS)(Stone & Veloso2000)来利用个体之间的合作来提高工作效率和有效性,本文称为多智体组。多智体组协同决策,以分布式、并行方式执行相应的动作、实现共同目标、显著提高工作效率和效益。然而,多智体组的主要问题是彼此之间如何沟通,动态分配任务并提高工作效率和有效性。随着LLM的发展,LLM驱动的自主智体(Richards2023; Nakajima2023; Reworkd2023)拥有更大的智能和自主能力,这可能有助于缓解这个问题。因此研究将一些智体概念化为一个组(Li 2023 ),并专注于探索协作的潜力。Park(2023)发现协作行为在一组智体中自主出现,Du(2023); Wang(2023b); Zhang (2023a); Qian (2023a); Chan(2023) 进一步利用协作来更好地完成推理任务。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值