文章目录 论文:RODE: LEARNING ROLES TO DECOMPOSE MULTI-AGENT TASKS 存在的问题&研究动机&研究思路 创新点 算法框图 some points 论文:RODE: LEARNING ROLES TO DECOMPOSE MULTI-AGENT TASKS 存在的问题&研究动机&研究思路 将复杂任务基于角色分解会有较好的scalable,但是角色如何学习(如何分组)是不好实现的。 作者基于动作的效果将智能体进行分组,将动作空间分解。 创新点 训练监督学习的模型,将one-hot形式的动作映射到一个隐空间 z \pmb z