qq_49058750-CSDN博客

原创无人机博弈:基于深度强化学习在线运动规划的多无人机追逃博弈

1.基于长短期记忆网络LSTM（处理有时间关系的数据）设计了TPNet，实现目标预测，达成先预测后决策的目的。采用监督学习的方法，训练数据包括：n个时间步长训练数据px(目标位置、agents位置和速度)和k个时间步长标签数据py(目标位置)采用AC结构，评论员能获取全局信息，行动者只能获取局部信息。Dis（j，tar）表示智能体j到目标的距离。3.改进DRL框架，考虑无人机的坠毁问题。2. 使用更逼真的仿真引擎Unity 3d，构建的用。二维平面，无人机飞行在不同高度，不会相撞。于无人机追逃的仿真环境。

2023-07-11 18:37:07 1733 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 无人机博弈:基于深度强化学习在线运动规划的多无人机追逃博弈

空空如也

空空如也

原创无人机博弈:基于深度强化学习在线运动规划的多无人机追逃博弈