【决策状态机FSM(finite state machine)梳理】

本文探讨了自动驾驶中的行为决策,包括基于规则和强化学习的方法。重点介绍了有限状态机(FSM)在行为决策中的作用,阐述了FSM的基础知识,如状态、事件、转移条件和动作。此外,还提到了Stanford FSM在DARPA Urban Challenge中的应用,以及如何使用Matlab/StateFlow构建有限状态机模型。FSM通过增强鲁棒性,应对道路阻挡、路口阻挡等复杂场景,提高了自动驾驶的安全性和效率。
摘要由CSDN通过智能技术生成

背景:写论文需要,对需要有限状态机部分进行整理。论文内容是关于自动驾驶避撞决策。

1. 行为决策

行为决策主要分为两类
1、基于规则的行为决策
2、基于强化学习的行为决策

1.1 基于规则的行为决策

在基于规则的行为决策中,有限状态机法是最经典也是最具有代表性的方法,其具有实用性强、可靠性高和逻辑推理清晰等特点。有限状态机是一种离散的数学模型,用来研究有限个状态以及状态之间的转移。

优点:其具有易于搭建和调整,实时性好,应用简单等

缺点:其难以适应所有情况,需要进行针对性调整,其行为规则库易重叠而失效,有限状态机难以覆盖车辆可能遇到的所有工况而导致决策错误。

1.2 基于强化学习的行为决策

基于强化学习算法的行为决策方法主要是利用各种学习算法来进行决策,利用无人车配备的各种传感器,来感知周边的环境信息,传递给强化学习决策系统,此时强化学习决策系统的作用就相当于人脑,来对各类信息进行分析和处理,并结合经验来对无人驾驶汽车做出行为决策。如自动驾驶汽车公司Waymo 就通过模拟驾驶及道路测试来获取了大量的数据对其基于学习算法的行为决策系统进行训练,使得该系统对物体的检测性能得到了极大地提高,还可以对障碍物进行语义理解等
主要方法有:马尔科夫决策、Q学习算法、神经网络Q

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值