自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

dmj3214的博客

QMIX

关注

文章平均质量分 92

关注数：文章数：1 文章阅读量：2109 文章收藏量：6

作者: 开飞机的贝塔儿

好好学习，天天向上！

展开

QMIX:用于深度多智能体强化学习的单调值函数分解

多智能体强化学习-QMIX 论文名称：QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning 01 介绍在多智能体强化学习中一种比较典型的学习模式为中心式训练，分布式执行，即在训练时利用所共享的信息来帮助更有效的分布式执行。然而，围绕如何最好地利用集中培训仍然存在着许多挑战。其中一个挑战是如何表示和使用大多数强化学习方法学习的动作值函数。一方面，正确地捕捉主体行为的影响，需要一个集中

原创 2020-08-24 18:00:21 · 2109 阅读 · 0 评论