强化学习自动驾驶论文阅读(四)

(一)paper传送门

Reinforcement Learning with Uncertainty Estimation for Tactical Decision-Making in Intersections

(二)背景知识

强化学习(RL)-------------------------------《Reinforcement Learning:An Introduction》第二版
Double DQN (DDQN)----------------------https://zhuanlan.zhihu.com/p/97853300
随机先验函数 (RPF)------------------------https://zhuanlan.zhihu.com/p/106394048
Bootstrapped DQN -----------------------------https://zhuanlan.zhihu.com/p/78273736
贝叶斯方法 ---------------------------------------https://blog.csdn.net/v_july_v/article/details/40984699

(三)摘要

本文利用贝叶斯强化学习,赋予智能体评估模型推荐的行动的能力,通过模拟十字交叉路口自动驾驶,与DDQN算法比较,该方法具有优势。其实就是,本文通过自举经验回放训练了一个ensemble RPF模型,估计Q值的分布,然后使用Q值的分布来估计推荐行动的不确定性,同时也提供agent采取决策的置信度,因此,利用不确定性信息选择未知情况下的安全动作,可以有效消除training distribution内的所有碰撞,以及training distribution外的大部分碰撞。为了方便理解,可以思考一个问题:如果我们将agent放在高速路上训练,测试的时候放在agent从未遇到的十字路口的时候,agent会根据输入的状态帧输出动作吗?答案是:会。这是一个很严重的问题,因此我们必须要让agent能对自己的动作做出评估才行,贝叶斯概率理论正好能一定程度解决这事。(不确定性的重要性可以看Bootstrapped DQN那篇博客)

(四)内容

1 问题

自动驾驶过程是很复杂的,依赖手动预测所有可能情况是不可能的,因此RL作为一种可以从经验轨迹学习的end-to-end方法逐渐被应用到自动驾驶领域,但是传统的RL,agent无法评估决策的不确定性。尽管,目前一些RL研究基于贝叶斯概率理论来评估不确定性,但是侧重于对探索进行优化,并没有提供agent采取决策的置信度。

2 主体

1>APPROACH

这里,DDQN相关知识略。
DDQN的损失函数为:

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于强化学习自动驾驶系统控制算法研究是一个广泛而长期的研究领域。该领域使用了各种不同的方法,包括深度强化学习(DRL)、优化技术、现代控制方法、人工智能和机器学习等。 近年来,基于深度强化学习的方法在自主驾驶运动规划中取得了显著的研究成果。这些方法主要通过训练智能代理使其能够在复杂环境中学习并做出决策。通过这种方式,自动驾驶系统可以通过与环境的交互来提高其驾驶能力。 然而,需要指出的是,尽管深度强化学习方法在解决自动驾驶的一些子任务上表现出了潜力,但目前还没有一个整体端到端的解决方案。一些论文试图通过经典的强化技术来解决自动驾驶的一些子任务,但这些方法存在无法处理非结构化数据的问题,如图像、中级雷达或激光雷达传感。 在基于强化学习自动驾驶系统控制算法研究中,问题的复杂性各不相同。简单的问题,如保持车道或车辆跟踪,通常可以追溯到简单的凸优化或控制问题。但在一些复杂的场景下,如在密集交通中机动,问题的有效完成很难被准确表述,需要智能代理具有预测性思维来实现目标。 总的来说,基于强化学习自动驾驶系统控制算法研究是一个需要综合考虑多个因素的复杂领域,包括问题的复杂性、行动空间的性质、奖励的设置等。该领域的研究目标是为了提高自动驾驶系统在各种不同场景下的驾驶能力和安全性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值