**基于深度强化学习的全覆盖路径规划飞行器**

论文题目《UAV Coverage Path Planning under Varying Power Constraints using Deep Reinforcement Learning》
论文主要内容:1.利用DDQN做路径规划
2.利用卷积神经网络处理全局地图
3.考虑能量约束,任意位置起降
摄像头给出当前的覆盖率视图,GPS给出无人机的位置

原理流程图

覆盖问题利用三通道的二维网格图分析,设置三个主要区域:起降区,禁飞区,目标区;一个网格区域可以同时被设置为这三个区域中的一个或者多个,但是不能同时事起降区和禁飞区。
飞行器位置使用独热码表示,它可以与三通道地图和覆盖网格以五通道输入网络的卷积层来编码。
实验
每次训练循环都有能量预算,每一个动作进行时,飞行器在当前位置无论是接受还是不接受都消耗一个单位的能量预算。
飞行器的初始位置由一个固定地图,零初始化的覆盖网格和位置组成
飞行器的摄像头可视范围设定为摄像头正下方3*3的网格区域,每一步动作后,地图都会标记覆盖网格中的可视范围
利用三个不同的地图进行训练,评估覆盖率和训练次数
训练地图

蓝色为起降区,黄色时初始位置,白色时终止位置,绿色时目标区,红色是禁飞区,黑色表示未覆盖
论文没有源码

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值