文章提出了一种名为“Internet of Agents”(IoA)的新框架,旨在克服现有大型语言模型多代理系统中的局限性,如第三方代理集成困难、分布式环境模拟不足以及硬编码通信管道等问题。IoA通过引入代理集成协议、即时消息架构设计以及动态团队组建和对话流程控制机制,实现了异构代理之间的高效协作。使得IoA在多种任务中均表现出优于现有技术的表现,展现了其在促进多代理协同工作的潜力,并为构建一个类似于互联网的多代理协作环境奠定了基础。

Internet of Agents: 异构代理网络_架构设计

1 Internet of Agents(IoA)框架

1架构设计:

  • 代理集成协议: IoA 设计了一套协议来确保不同来源的代理可以相互识别、通信和协作。
  • 即时消息架构: 采用了类似于互联网上的即时通讯系统的架构,使得代理之间的消息传递高效且可靠。
  • 动态团队组建: 允许智能体根据任务需求动态地组成团队,这有助于解决特定问题或完成特定任务。

2代理通信:

  • 任务导向通信: 提供了一种机制,使代理能够基于任务需求进行有效的沟通,包括请求、响应和服务提供。
  • 对话流程控制: 确保代理之间的对话流畅并按预期进行,避免误解和冲突。

3异构代理支持:

  • 多样化的代理集成: 支持来自不同开发者的代理加入 IoA 生态系统,这意味着代理可以有不同的功能、来源和背景。
  • 开放性与互操作性: 提供了一个开放的平台,允许不同类型的代理之间实现互操作,无论它们是在哪个框架下开发的。

4协作能力:

  • 高效协作: 通过优化的通信协议和架构,确保代理能够高效地协作处理复杂任务。
  • 适应性: 代理可以根据环境变化和任务需求调整其行为策略。

Internet of Agents: 异构代理网络_语言模型_02

2 框架实施细节

1Agent Integration Protocol (代理集成协议)

  • 目的: 解决第三方代理集成的问题,使得不同背景和功能的代理能够在IoA框架内无缝协作。
  • 机制: 提供了一个标准化的接口和通信协议,允许第三方代理按照统一的标准接入IoA平台。这确保了无论代理运行在何处,都能够被发现和集成到协作网络中。

2Instant Messaging-Like Architecture Design (即时消息式架构设计)

  • 目的: 促进代理之间的发现与动态组队。
  • 机制: 设计了一个类似于即时消息应用的架构,允许代理自主搜索和识别能处理特定任务的潜在合作伙伴,并且能够根据需要动态地组成不同的团队。每个团队可以通过“群聊”的形式进行沟通,类似于人们在日常工作中使用即时消息软件的方式。

3Dynamic Mechanisms for Agent Teaming and Conversation Flow Control (动态机制用于代理组队与对话流程控制)

  • 目的: 使代理能够根据任务需求自主决定团队成员和调整对话状态。
  • 机制: 借鉴了言语行为理论(Speech Act Theory),抽象出了几种对话状态,并提供了一个灵活通用的状态机机制。这种机制让代理能够自主决定对话的状态,比如讨论还是执行子任务,从而更好地适应任务的变化。

4Task Assignment and Execution (任务分配与执行)

  • 目的: 实现任务的有效分配与高效执行。
  • 机制: 在代理组成的团队中,通过动态机制确定哪些代理负责哪些子任务,并确保任务能够按计划得到执行。这一过程通常伴随着代理间的协商与协调,确保任务分配合理且高效。

5Embodied Agent Tasks (具身代理任务)

  • 目的: 支持涉及物理世界互动的任务。
  • 机制: 在IoA框架下,具身代理不仅能够处理语言任务,还能执行需要与物理环境交互的任务,如移动物体、导航等。这些任务要求代理具备感知环境、做出决策并在现实世界中执行动作的能力。

3 结语

文章提出了一种名为Internet of Agents (IoA)的新框架,它通过灵活和可扩展的方法促进了大型语言模型基础上的多代理协作,展示了在多种任务中超越现有技术的表现。

论文题目:Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

论文链接:https://www.arxiv.org/abs/2407.07061


PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!

Internet of Agents: 异构代理网络_语言模型_03

精彩回顾

1.  大语言模型的视频推理分割--ViLLa

 2. 大语言模型稀疏水印技术

3 . LazyLLM:长上下文场景下提高LLM推理效率