【四】多智能体强化学习(MARL)近年研究概览 {Learning cooperation(协作学习)、Agents modeling agents(智能体建模)}
最新推荐文章于 2024-08-13 09:46:33 发布
本文概述了多智能体强化学习(MARL)中的协作学习和智能体建模方法。在协作学习中,文章介绍了基于值函数、演员-评论家和经验回放的算法,如Value-Decomposition Networks、QMIX、QTRAN等。这些方法通过分解联合Q函数,处理环境非平稳性和智能体间复杂关系。在智能体建模部分,探讨了如何通过估计其他智能体策略来提高协作效率。
摘要由CSDN通过智能技术生成