QMIX:用于深度多智能体强化学习的单调值函数分解
多智能体强化学习-QMIX
论文名称:QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
01 介绍
在多智能体强化学习中一种比较典型的学习模式为中心式训练,分布式执行,即在训练时利用所共享的信息来帮助更有效的分布式执行。然而,围绕如何最好地利用集中培训仍然存在着许多挑战。
其中一个挑战是如何表示和使用大多数强化学习方法学习的动作值函数。一方面,正确地捕捉主体行为的影响,需要一个集中
原创
2020-08-24 18:00:21 ·
2109 阅读 ·
0 评论