python实现多智能体一致性_多智能体强化学习入门（八）——图卷积强化学习DGN...

最新推荐文章于 2022-10-22 06:45:14 发布

weixin_39913628

最新推荐文章于 2022-10-22 06:45:14 发布

阅读量617

点赞数

文章标签： python实现多智能体一致性多智能体深度强化学习的主要困难

本文介绍了利用图卷积网络解决多智能体深度强化学习中智能体间交互关系的问题。DGN通过图卷积、关系核和时序关系正则化学习智能体间的交互，实现一致性。实验比较了DGN、DGN-R和DGN-M三种变体的效果。

摘要由CSDN通过智能技术生成

GRAPH CONVOLUTIONAL REINFORCEMENT LEARNING

一、创新点及概要

多智能体任务中，环境具有高动态性，各个智能体的状态都在快速改变，如何学习两个智能体之间的交互关系是一个关键问题。这篇文章从图网络的角度来对交互进行建模，主要有以下三个技巧来学习智能体之间的交互关系：

利用图卷积来处理智能体邻居数量不确定的问题，并且随着卷积层增加，每个智能体的感知域随之扩大。
涉及关系核（relation kernels），即多头注意力机制（multi-head attention mechanism）来对智能体之间的交互进行建模。
时序关系正则化（temporal relation regularization）来确保交互关系的一致性，能够让学习更稳定。

多智能体环境被建模为一个图网络，每个节点表示一个智能体，节点特征为该智能体观测到的状态。每个智能体与其邻居之间连接一条边。作者将该算法称为DGN，基于Q-learning拓展出来的算法。每层图网络利用attention机制对邻居节点信息进行加权更新自己节点的状态，随着层数的增加每个智能体的感知域随之扩大，因为根据图网络更新规则，每次利用邻居信息来更新自身节点信息，而邻居也在利用他的邻居更新他自身，故随着图网络层数的增多，每个节点所能获取信息

最低0.47元/天解锁文章

weixin_39913628

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python实现多智能体一致性_多智能体强化学习入门（八）——图卷积强化学习DGN...

GRAPH CONVOLUTIONAL REINFORCEMENT LEARNING 一、创新点及概要多智能体任务中，环境具有高动态性，各个智能体的状态都在快速改变，如何学习两个智能体之间的交互关系是一个关键问题。这篇文章从图网络的角度来对交互进行建模，主要有以下三个技巧来学习智能体之间的交互关系：利用图卷积来处理智能体邻居数量不确定的问题，并且随着卷积层增加，每个智能体的感知域随之扩大。涉及关...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。