编队控制
文章平均质量分 93
小王爱学习1234
我爱学习,学习爱我
展开
-
论文研读笔记(五)——通过单机器人进化策略搜索增强多机器人导航的深度强化学习方法
解决非平稳性的多智能体合作,结合EPS增强机器人的探索以及提高样本效率,使用DRL训练机器人策略,并利用进化算法优化策略空间,最后将策略参数交叉注入多机器人设置以提高性能和采样效率。...原创 2022-08-30 13:27:51 · 1559 阅读 · 1 评论 -
论文研读笔记(三)——基于障碍函数的移动机器人编队控制安全强化学习
提出一种基于障碍函数的安全强化学习算法,用于状态约束下的非线性多机器人系统DMPC。所提出的方法由几个基于本地学习的 MPC 监管机构组成。每个与本地系统相关联的调节器都使用安全的强化学习算法以分布式方式学习和部署本地控制策略,即仅在相邻代理之间使用状态信息。作为所提出算法的一个突出特点,文中提出了一种新颖的基于障碍的策略结构来确保安全,该结构具有清晰的机制解释。...原创 2022-08-29 13:38:27 · 3032 阅读 · 2 评论 -
论文研读笔记(二)——通过深度强化学习避免碰撞的编队控制
通过学习一项综合任务将基于学习的策略扩展到编队控制领域。特别是采用了模仿学习和强化学习的两阶段训练方案。提出了一种融合奖励函数来引导训练。此外,提出了一种面向编队的网络架构用于环境感知,并应用长短期记忆(LSTM)来感知任意数量的障碍物的信息。进行了各种模拟,结果表明所提出的算法能够预测环境的动态信息,并且优于传统方法。...原创 2022-08-28 13:19:19 · 4125 阅读 · 5 评论