AgentVerse: 多智体协同和智体涌现行为

三谷秋水

于 2024-05-20 05:39:36 发布

阅读量816

点赞数 15

分类专栏：智能体大模型文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yorkhunter/article/details/139051973

版权

大模型同时被 2 个专栏收录

742 篇文章

订阅专栏

515 篇文章

订阅专栏

23年8月份来自清华大学、北邮和腾讯的论文“AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents“。

大语言模型（LLM）使自主智体已经有了重大改进，能够跨广泛的任务进行泛化。然而，在现实世界的场景中，通常需要个人之间的合作来提高任务完成的效率和有效性。因此，受人群动力学的启发，作者提出一个多智体框架AGENTVERSE，协作和动态地调整其组成，作为一个“大于各部分之和”的系统。实验表明，AGENTVERSE框架可以有效地部署多智体组，比单智体更强大。此外，深入研究在协作任务完成过程中群体内个体智体之间社会行为的出现。鉴于这些行为，讨论了一些可能的策略，用积极的策略并减轻消极的策略，提高多智体组的协作潜力。

AGENTVERSE将智体组问题解决过程分为四个关键阶段，如图所示：（1）专家招聘（expert recruitment） - 招聘模块根据当前解决问题的进度调整专家智体。（2）协作决策（cooperative decision- making） - 招募的智体参与协作讨论，旨在制定解决所提出的问题的策略。一旦达成共识，就会提出拟议的动作。（3）动作执行（action execution）- 智体与环境交互以执行动作。（4）评估（evaluation） - 执行动作后，该模块评估当前状态与期望目标（goal）之间的差异。如果当前状态达不到预期，则会向第一阶段发送反馈奖励，并动态调整智体组的组成，促进下一轮的协作。

添加图片注释，不超过 140 字（可选）

相关工作

创建现实世界环境中智能运行的自主智体，一直是AI历史上的一个持续目标（Wooldridge & Jennings 1995; Minsky 1988; Bubeck2023）。最近LLM（Touvron2023a; OpenAI2023）为实现这一目标开辟了更多新的机会。这些LLM具有非凡的理解、推理和生成能力，允许自主智体（Richards2023; Nakajima2023; Reworkd2023），作为处理日益复杂场景的骨干。然而，即使这些自主智体已经表现出相当大的力量，仍然缺乏某些基本的类人认知能力。因此，一些研究设计了赋予智体反射的外部机制（Yao2023b; Shinn2023）、任务分解（Wei2022b; Yao2023a）和工具利用/创建（Schick2023; Qin2023a/b; Qian2023b）能力。这些进步使当前的自主智体更接近实现通用AI。

在人类社会中，由个体组成的组织良好群体通常可以协作处理更大的工作量，并以更高的效率和效果完成复杂的任务。在人工智能领域，研究人员从人类社会中汲取灵感，旨在通过研究多智体系统（MAS）（Stone & Veloso2000）来利用个体之间的合作来提高工作效率和有效性，本文称为多智体组。多智体组协同决策，以分布式、并行方式执行相应的动作、实现共同目标、显著提高工作效率和效益。然而，多智体组的主要问题是彼此之间如何沟通，动态分配任务并提高工作效率和有效性。随着LLM的发展，LLM驱动的自主智体（Richards2023; Nakajima2023; Reworkd2023）拥有更大的智能和自主能力，这可能有助于缓解这个问题。因此研究将一些智体概念化为一个组（Li 2023 ），并专注于探索协作的潜力。Park（2023）发现协作行为在一组智体中自主出现，Du（2023）; Wang（2023b）; Zhang （2023a）; Qian （2023a）; Chan（2023）进一步利用协作来更好地完成推理任务。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。