TPAMI 2024 | 具有图信息瓶颈优化的鲁棒多Agent通信

252 篇文章 15 订阅 ¥49.90 ¥99.00
本文提出了一个基于图信息瓶颈优化的鲁棒多智能体通信机制(MAGI),用于多智能体强化学习(MARL)中通信学习的优化。研究发现,传统基于GNN的通信方法易受对抗性攻击和噪声影响,而MAGI通过最小化无用信息并最大化与动作选择相关的信息,提高了通信的效率和鲁棒性。MAGI利用信息论正则化器来学习最小且充分的通信消息表示,增强了多智能体的动作协调。实验表明,MAGI在多种环境中表现出优于现有方法的性能和鲁棒性。
摘要由CSDN通过智能技术生成

题目:Robust Multi-Agent Communication With Graph Information Bottleneck Optimization

具有图信息瓶颈优化的鲁棒多Agent通信

作者:Shifei Ding; Wei Du; Ling Ding; Jian Zhang; Lili Guo; Bo An


摘要

最近关于多智能体强化学习(MARL)的研究表明,通过引入通信学习机制可以显著增强多智能体的动作协调。同时,图神经网络(GNN)为MARL的通信学习提供了一个有前景的范式。在这一范式下,智能体和通信信道可以被视为图中的节点和边,智能体可以通过GNN从邻近智能体聚合信息。然而,这种基于GNN的通信范式容易受到对抗性攻击和噪声扰动的影响,如何在扰动下实现鲁棒的通信学习在很大程度上被忽视了。为此,本文探讨了这个问题,并引入了一个具有图信息瓶颈优化的鲁棒通

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小白学视觉

您的赞赏是我们坚持下去的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值