相关文章:
【二】最新多智能体强化学习文章如何查阅{顶会:AAAI、 ICML }
【三】多智能体强化学习(MARL)近年研究概览 {Analysis of emergent behaviors(行为分析)_、Learning communication(通信学习)}
【四】多智能体强化学习(MARL)近年研究概览 {Learning cooperation(协作学习)、Agents modeling agents(智能体建模)}
1.连续动作状态空间算法
1.1 MADDPG
Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
这是OpenAI团队和McGill大学、UC Berkeley于2017合作发表在NIPS(现在称NeurIP