基于强化学习的巨型星座离散时间路由策略

本文提出了一种基于深度强化学习的卫星巨型星座抗干扰路由策略,考虑信息年龄、队列增长率和距离作为奖励,优化多目标。通过与传统路由算法比较,该策略在数据实时性、鲁棒性和资源利用上表现出优势,适用于动态和受干扰的网络环境。
摘要由CSDN通过智能技术生成

【摘   要】由于天地一体化网络中移动性和时变环境导致的流量负载、拓扑结构和资源可用性的高时空动态特性,需要考虑当有恶意的网络行为攻击卫星时,如何在未知的网络中探索高效智能的网络优化方案。针对这一问题,以信息年龄、时延抖动率作为多优化目标,提出了一种基于深度强化学习的卫星巨型星座抗干扰路由策略,设置信息年龄、队列增长率以及距离为奖励,实现目标的优化。仿真结果表明,与现有的路由算法相比,该算法不仅可以保证数据的时效性、受到干扰时卫星网络路由的鲁棒性,还可以有效利用星间资源,提升网络的整体性能。

【关键词】深度强化学习;卫星巨型星座;信息年龄;离散时间动态虚拟拓扑路由策略 

0   引言

随着科技的发展以及人类生产生活范围的扩大,各种各样的物联网设备将涵盖海洋、山区、沙漠、太空等广阔的区域。5G地基网络也难以适应网络空间越来越广泛的通信需求,在此背景下,建设空天地一体化网络,深度融合天基网络、空基网络、地基网络,充分发挥不同网络维度的功能,实现广域全覆盖和网络的互联互通,成为亟待研究的问题[1]。

其中,天基网络技术处于核心地位,其由各种卫星系统构成,实现了全球覆盖以及泛在连接等功能。随着以美国Starlink计划为代表的低轨卫星星座技术的逐渐成熟ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

米朵儿技术屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值