- 博客(1)
- 收藏
- 关注
原创 无人机博弈:基于深度强化学习在线运动规划的多无人机追逃博弈
1.基于长短期记忆网络LSTM(处理有时间关系的数据)设计了TPNet,实现目标预测,达成先预测后决策的目的。采用监督学习的方法,训练数据包括:n个时间步长训练数据px(目标位置、agents位置和速度)和k个时间步长标签数据py(目标位置)采用AC结构,评论员能获取全局信息,行动者只能获取局部信息。Dis(j,tar)表示智能体j到目标的距离。3.改进DRL框架,考虑无人机的坠毁问题。2. 使用更逼真的仿真引擎Unity 3d,构建的用。二维平面,无人机飞行在不同高度,不会相撞。于无人机追逃的仿真环境。
2023-07-11 18:37:07 804 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人