论文阅读
文章平均质量分 94
kaohoooo
这个作者很懒,什么都没留下…
展开
-
论文学习|多智能体强化学习MAAC:基于attention的actor-critic类可扩展MADRL算法
MAAC是基于actor-critic的[learn to cooperate]类多智能体强化学习算法,算法结合了MADDPG、COMA、VDN以及attention机制。原创 2023-02-24 10:35:17 · 2487 阅读 · 0 评论 -
论文阅读|Nash Q-Learning for General-Sum Stochastic Games基于强化学习的多智能体研究(附代码)
本文研究的是将Q-learning应用到竞争的多智能体中(多智能体的关系包括竞争、合作、竞争与合作--超市老板与顾客),整体基于广义随机博弈的游戏框架。每个智能体通过联合动作共同维护Q函数,并基于对当前Q值假设的Nash均衡行为来更新,可证明其是收敛的,附有代码。原创 2022-10-19 10:28:07 · 4180 阅读 · 4 评论