e325: attention怎么解决_Multi-Actor-Attention-Critic (MAAC)

最新推荐文章于 2024-05-13 18:56:45 发布

利益第三人

最新推荐文章于 2024-05-13 18:56:45 发布

阅读量807

点赞数 1

文章标签： e325: attention怎么解决

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32380501/article/details/113068065

版权

第一次写知乎文章，以前的论文整理都是自己收起来的，但这篇论文写得真的太好了，发到知乎上一方面是让自己更认真地看paper，理清楚脉络，另外也是希望如果有理解错误的地方dalao们可以指正。提前谢过。

这篇文章解决的问题和18年PKU那篇 NIPS（Learning Attentional Communication for Multi-Agent Cooperation）一样，但两者的解决思路截然不同。

PKU的思路是针对initiator去找一个好的 communication group ，但问题是：

首先，也是最大的问题， initiator 的确定是很模糊的，整片文章也规避了initiator的选择问题。而且由于 initiator 的决定性作用，假如初始选择的不好，整个模型会灾难性地挂掉。

其次，邻居的范围怎么定呢？这也是一个手动调的东西...

这两个问题使得复现论文非常困难。

而本篇的解决思路是centralized的attention，从根本上不存在前述的问题。

核心公式是用 centralized 的网络作为 critic 得到value：

最低0.47元/天解锁文章

利益第三人

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
e325: attention怎么解决_Multi-Actor-Attention-Critic (MAAC)

第一次写知乎文章，以前的论文整理都是自己收起来的，但这篇论文写得真的太好了，发到知乎上一方面是让自己更认真地看paper，理清楚脉络，另外也是希望如果有理解错误的地方dalao们可以指正。提前谢过。这篇文章解决的问题和18年PKU那篇 NIPS（Learning Attentional Communication for Multi-Agent Cooperation）一样，但两者的解决思路截然不...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。