聊聊LLM 时代的 multi-agent 系统协作关系和竞争关系
原创作者:紫气东来
原创地址:https://zhuanlan.zhihu.com/p/665644399
事实上,在 LLM 的背景下,multi-agent 系统已经逐渐成为主流的应用方案。本文将试图从多个角度研究和讨论以 LLM 为基础的 multi-agent 系统的发展过程及算法特点。
一、前 LLM 时代的 multi-agent 系统
在 LLM 出现之前,multi-agent 主要存在于强化学习和博弈论(game theory) 的相关研究中。由于笔者之前从事强化学习相关研究,那么本节将主要介绍强化学习中的 multi-agent 系统。
multi-agent 系统相比于 single agent 更加复杂,因为每个 agent 在和环境交互的同时也在和其他 agent 进行直接或者间接的交互。因此,multi-agent 强化学习要比 single agent 的建模和优化更困难,其难点主要体现在以下几点:
-
由于多个 agent 在环境中进行实时动态交互,并且每个 agent 在不断学习