多智能体深度强化学习
文章平均质量分 92
小王爱学习1234
我爱学习,学习爱我
展开
-
论文研读笔记(五)——通过单机器人进化策略搜索增强多机器人导航的深度强化学习方法
解决非平稳性的多智能体合作,结合EPS增强机器人的探索以及提高样本效率,使用DRL训练机器人策略,并利用进化算法优化策略空间,最后将策略参数交叉注入多机器人设置以提高性能和采样效率。...原创 2022-08-30 13:27:51 · 1534 阅读 · 1 评论 -
论文研读笔记(二)——通过深度强化学习避免碰撞的编队控制
通过学习一项综合任务将基于学习的策略扩展到编队控制领域。特别是采用了模仿学习和强化学习的两阶段训练方案。提出了一种融合奖励函数来引导训练。此外,提出了一种面向编队的网络架构用于环境感知,并应用长短期记忆(LSTM)来感知任意数量的障碍物的信息。进行了各种模拟,结果表明所提出的算法能够预测环境的动态信息,并且优于传统方法。...原创 2022-08-28 13:19:19 · 3836 阅读 · 4 评论 -
论文研读笔记(一)——多智能体强化学习的相对分布编队和避障
尽管模型预测控制 (MPC) 和模糊控制等一些经典控制器取得了一定程度的成功,但它们中的大多数都需要在恶劣环境中无法获得的精确全局信息。另一方面,一些基于强化学习(RL)的方法采用领导者-跟随者结构来组织不同代理的行为,这牺牲了代理之间的协作,从而在可操作性和鲁棒性方面遇到瓶颈。在本文中,我们提出了一种基于多智能体强化学习(MARL)的分布式编队和避障方法。我们系统中的代理仅利用本地和相关信息来做出决策并分布式控制自己。......原创 2022-08-27 12:46:25 · 4788 阅读 · 3 评论 -
论文研读——n个物体相互间的碰撞避免
论文研读——Reciprocaln-body Collision Avoidance此篇文章为论文的学习笔记,只供学习使用,不作商业用途,侵权删除。并且本人学术功底有限,如有思路不正确的地方欢迎批评指正!摘要在本文中,我们提出了一种形式化的n个物体相互避碰方法,其中多个移动机器人在一个共同的工作空间中移动时需要避免彼此碰撞。在我们的公式中,每个机器人完全独立行动,不与其他机器人通信。在速度障碍定义的基础上,通过将问题简化为求解一个低维线性规划,得到了无碰撞运动的充分条件。我们在几个密集而复杂的模拟场景原创 2021-11-15 18:22:53 · 4468 阅读 · 2 评论 -
论文研读——基于深度强化学习的自动驾驶汽车运动规划研究综述
论文研读——Survey of Deep Reinforcement Learning for Motion Planning of Autonomous V ehicles摘要除了经典的控制设计方法外,人工智能和机器学习方法几乎都存在于这些领域。另一部分研究集中在运动规划的不同层面,如战略决策、轨迹规划和控制。机器学习本身已经开发了广泛的技术,本文将介绍其中的一个领域——深度强化学习(Deep Reinforcement Learning, DRL)。本文深入了解了分层运动规划问题,并描述了DRL的基原创 2021-11-15 14:35:10 · 6173 阅读 · 1 评论 -
论文研读——机器人导航深度局部轨迹重规划与控制
论文研读——Deep Local Trajectory Replanning and Control for Robot Navigation此篇文章为论文的学习笔记,只供学习使用,不作商业用途,侵权删除。并且本人学术功底有限,如有思路不正确的地方欢迎批评指正!摘要文中提出了一个结合分层规划和机器学习思想的导航系统。该系统使用传统的全局规划器来计算到达目标的最优路径,并使用深度局部轨迹规划器和速度控制器来计算运动命令。系统的后一个组件通过注意机制调整机器人的行为,使其向目标移动,避免障碍,并尊重附近行原创 2021-11-14 21:03:05 · 1209 阅读 · 0 评论 -
深度学习传感器融合技术在自动驾驶汽车感知与定位中的应用研究进展
论文研读——Deep Learning Sensor Fusion for AutonomousV ehicle Perception and Localization: A Review深度学习传感器融合技术在自动驾驶汽车感知与定位中的应用研究进展摘要1、介绍2、传感器技术和传感器融合概述2.1 介绍了传统传感器融合方法2.2 介绍了深度学习传感器融合方法3、环境感知:局部动态感知图4、自我定位与映射5、结论和未来的研究建议V ehicle Perception and Localization: A原创 2021-11-14 20:03:27 · 2641 阅读 · 0 评论 -
多智能体强化学习——相关论文
基于强化学习的移动多智能体自组织协同目标搜索时间:2020年4月作者:狄小娟 (南京邮电大学)摘要:本文研究出一种基于强化学习的多智能体系统来实现对目标群体的协同搜索,使其在脱离人工干预的情况下正常运作,对提高多智能体协同合作的搜索效率具有现实意义。本学位论文以多智能体高效协同搜索为目标,在移动自组织网络路由协议改进的基础上结合强化学习的方法以及特殊的搜索覆盖策略来实现。首先设计一种基于优化链路状态协议改进的更适用于多智能体目标搜索任务的自组织网络路由协议,然后设计一种基于传统深度确定性策略梯度算法原创 2021-08-17 15:07:11 · 1782 阅读 · 0 评论 -
Deep Q-learning (DQN) for Multi-agent Reinforcement Learning
多智能体强化学习的深度Q学习(DQN)背景我们从回顾单智能体和多智能体强化学习开始。单智能体强化学习$ \quad $在单智能体、完全可观察的RL设置中,有一个智能体通过采取行动与环境交互。在每次t时,智能体观察环境的当前状态St ∈ S,根据随机策略π选择一个动作Ut∈ U,并接收奖励信号Rt= r(St,Ut)。然后,环境根据转移概率函数P(St+1 | St,Ut) 转移到新的状态St+1∈ S。目标是为代理人找到一个最大化折扣回报期望的策略π\piπ,Gt=Σk=t∞γk−tRt G_t原创 2021-08-14 18:22:59 · 4012 阅读 · 6 评论 -
论文研读-Deep Multi-Agent Reinforcement Learning-2
深度多智能体强化学习(DMARL)此篇文章为 博士学位论文:Deep Multi-Agent Reinforcement Learning 的论文学习笔记,只供学习使用,不作商业用途,侵权删除。并且本人学术功底有限如果有思路不正确的地方欢迎批评指正!多智能体强化学习是一个非常有趣的研究领域,它与单智能体强化学习、多智能体系统、博弈论、进化计算和优化理论有着密切的联系。(二)介绍2.1 工业革命,认知和计算机蒸汽机 1 以及随之而来的工业革命导致了机器对人类劳动的迅速替代。这些发展给人类生活的各个方原创 2021-08-13 18:55:21 · 836 阅读 · 0 评论 -
论文研读-Deep Multi-Agent Reinforcement Learning-1
标题深度多智能体强化学习(DMARL)此篇文章为 博士学位论文:Deep Multi-Agent Reinforcement Learning 的论文学习笔记,只供学习使用,不作商业用途,侵权删除。并且本人学术功底有限如果有思路不正确的地方欢迎批评指正!多智能体强化学习是一个非常有趣的研究领域,它与单智能体强化学习、多智能体系统、博弈论、进化计算和优化理论有着密切的联系。(一)论文摘要在这篇论文中,我们开发和评估了新的深度多智能体强化学习方法,以解决这些环境中出现的独特挑战。这些挑战包括学会合作、沟原创 2021-08-13 12:43:57 · 823 阅读 · 0 评论