自动驾驶
文章平均质量分 96
龙晨天
我不做码农,就做一个代码的搬运工!
展开
-
论文复现:一种基于强化学习的车辆队列控制策略,用于减少交通振荡中的能量消耗
A Reinforcement Learning-Based Vehicle Platoon Control Strategy for Reducing Energy Consumption in Traffic Oscillations论文的复现记录原创 2024-03-07 08:00:00 · 2076 阅读 · 0 评论 -
论文翻译:一种基于强化学习的车辆队列控制策略,用于减少交通振荡中的能量消耗
摘要:车辆队列将是未来道路上最主要的驾驶模式。据我们所知,很少有强化学习(RL)算法应用于具有大规模动作和状态空间的车辆队列控制。一些基于RL的方法被应用于解决单智能体问题。如果我们需要解决多智能体问题,我们将使用多智能体RL算法,因为参数空间随着所涉及的智能体数量的增加呈指数增长。以前的多智能体强化学习算法通常会向智能体提供冗余信息,指示大量无用或不相关的信息,这可能导致收敛训练和从共享信息中提取模式变得困难。此外,随机动作通常会导致崩溃,尤其是在训练开始时。原创 2024-03-06 19:18:55 · 936 阅读 · 0 评论 -
一种基于强化学习的自动变道机动方法
变道是一项至关重要的车辆操作,需要与周围车辆协调。建立在基于规则的模型上的自动换道功能可能在预定义的操作条件下表现良好,但在遇到意外情况时可能容易失败。在我们的研究中,我们提出了一种基于强化学习的方法来训练车辆智能体学习自动变道行为,以便它可以在各种甚至不可预见的情况下智能地进行变道。特别是,我们将状态空间和动作空间都视为连续的,并设计了一个具有闭式贪心策略的 Q 函数逼近器,这有助于提高深度 Q 学习算法的计算效率。原创 2023-02-20 16:15:42 · 1472 阅读 · 2 评论 -
具有非线性动态行为的多车辆列队行驶问题的基于强化学习的方法
协同智能交通系统领域的最新研究方向之一是车辆编队。研究人员专注于通过传统控制策略以及最先进的深度强化学习 (RL) 方法解决自动驾驶车辆控制的各种方法。在这项研究中,除了提出基于 RL 的最优间隙控制器之外,还重新引入了详细的非线性动力车辆模型,这通过具有深度确定性策略梯度算法的 actor critic 策略进行了证明。生成的智能体针对可变速度和可变间隙侵略性场景进行模拟,并与模型预测控制 (MPC) 性能进行比较。结果表明,准确性和学习时间之间存在权衡。但是,两个控制器都具有接近最佳的性能。原创 2023-02-17 16:17:49 · 858 阅读 · 0 评论