基于多智能体深度强化学习的多域协同抗干扰方法研究

目录

0 引言

1 相关工作

2 系统模型与问题建模

2.1 系统模型

图1

图2

2.2 问题建模

3 多域协同抗干扰方法

3.1 多用户马尔可夫决策过程

图3

3.2 信道选择和数据调度联合决策算法

图4

4 仿真结果与分析

4.1 仿真参数设置

4.2 仿真分析

图5

图6

图7

图8

图9

图10

图11

图12

图13

5 存在的问题及挑战

6 结束语


摘要

动态的传输需求和有限的缓存空间给恶意干扰环境下的无线数据传输带来巨大挑战。针对上述问题,从频域和时域的角度出发,研究了面向分布式物联网的协同抗干扰信道选择和数据调度联合决策方法,构建了基于多用户马尔可夫决策过程的数据传输模型,提出了基于多智能体深度强化学习的协同抗干扰信道和数据联合决策算法。仿真表明,所提算法可有效避开恶意干扰并避免同频互扰。相较于对比算法,网络吞吐量显著提高,丢包数量明显降低。

关键词: 协同抗干扰 ; 信道选择 ; 数据调度 ; 多智能体强化学习 ; 深度学习

0 引言

随着 5G 网络的普及和对未来 6G 技术的广泛研究,物联网等新型无线网络让人们的生活越来越便利且智能

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宋罗世家技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值