一文详解自动驾驶决策规划中的问题与挑战

最新推荐文章于 2024-08-03 13:42:56 发布

自动驾驶之心

最新推荐文章于 2024-08-03 13:42:56 发布

阅读量861

点赞数

文章标签：算法编程语言机器学习人工智能深度学习

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247504413&idx=2&sn=09f377c1ff8bbc63ad9d2c2538d3ac69&chksm=ceb8ffd4f9cf76c2830ba3c40b2a365d7b3be9a9b1f048f7404ba4ca1e20ec1c41f32df975fa&scene=126&&sessionid=0

版权

作者 | 小作坊钳工编辑 | ADS智库

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

点击进入→自动驾驶之心技术交流群

后台回复【规划控制综述】获取自动驾驶、智能机器人规划控制最新综述论文！

在自动驾驶的定位、感知、预测、决策规划和控制等模块中：

感知模块就像是人的眼睛和耳朵，负责对外部环境进行感知；
控制模块就像人的双手和双脚，负责最终的加减速、转向等操作；
而决策规划模块就像人的大脑，基于接收到的感知等信息进行行为决策和轨迹生成。

正如人的大脑又分为左脑和右脑一样，决策规划模块又可以继续分为行为决策层（Behavioral Layer）和运动规划层（Motion Planning）。

其中，行为决策层在接收到全局路径后，结合感知信息，进行具体的行为决策；
运动规划层根据具体的行为决策，规划生成一条满足特定约束条件的轨迹，该轨迹作为控制模块的输入决定车辆最终行驶路径。

随着自动驾驶等级的不断提高，决策规划层作为自动驾驶的大脑，其重要性也随之提高。但与人脑相比，自动驾驶的这颗大脑还有太长的路需要追赶。

本文将详述路径规划中的 Motion Planning 存在的问题与挑战。

PART.

Motion Planning常用算法

Motion Planning 算法是从机器人领域发展起来的，逐渐发展出适用于自动驾驶领域的各种算法。

论文 [1] 对 Motion Planning 的轨迹生成方法做了综述，介绍的方法如下图所示。

基于采样搜索的算法：Dijkstra、RRT、A*、hybird A* 和 Lattice 等；
基于曲线插值的算法：RS 曲线、Dubins 曲线、多项式曲线、贝塞尔曲线和样条曲线等；
基于最优化的算法：Apollo 的 piecewise-jerk 等；

上述算法一般都是相互结合在一起使用的。比如多项式曲线需要对终端状态进行采样、贝塞尔曲线对控制点进行采样、hybird A* 中使用到了 RS 曲线或者 Dubins 曲线等。

论文 [1] 总结了各种轨迹生成算法的优缺点，如下图所示。可见没有哪一种算法是完美的，需要结合具体的场景和工况选用合适的算法。目前行业内应用比较多的是多项式曲线插值(高速场景)和最优化的算法。

PART.

Motion Planning 问题与挑战

上述介绍的 Motion Planning 的算法，基本能解决大部分的自动驾驶场景轨迹生成问题，轨迹生成算法已经不是主要瓶颈。

但是在 Motion Planning 领域内仍然存在许多挑战需要去攻克，主要包括：①最优性问题；②认知推理问题；③不确定性问题 ( Uncertainty / Probability )；④Single-Agent；⑤Multiple-Agent；⑥工程化问题。

2.1

最优性问题

全局最优是 NP-hard 问题 [3]，为了实时性，行业内多数采用横纵向解耦的规划方法。但是这么做会牺牲最优性，在一些工况下不能得到良好的车辆行为，比如超车 [2]、对向来车、向心加速度约束处理、横向规划需要考虑纵向规划能力等。

例如，当自动驾驶主车 ( Autonomous Driving Car ，ADC ) 前方有一个减速行驶的车辆时，横纵向解耦的方法一般只有当前方车辆车速降低到一定值时才会超车行驶。ADC 的行为表现就是先减速甚至停车，然后再绕障行驶，这显然不是最优的行驶策略。

如果采用时空一体化规划方法，则可以避免减速或者停车行为。下图中左图是解耦方法的示例，在前方有减速停车车辆时，ADC 会进行减速。右图是时空规划的示例，在前方车辆减速时 ADC 会进行超车。

2.2

认知推理问题

2.2.1 地图拓扑推理

以 Apollo 为例，PNC Map 模块从 HD Map 模块提取数据形成参考线，并且通过HD Map 模块的 API 接口查询道路元素。但 Motion Planning 模块会忽略了一些道路的拓扑关系，例如汇入汇出路口，而这些特殊的道路拓扑是会影响到车辆的行为。

此外，在没有 HD Map 模块而单纯依靠视觉车道线的情况下，此时感知车道线会发生异常。在汇入汇出道路和十字路口道路中，其道路拓扑问题尤为凸显。

2.2.2 障碍物统一建模

交通场景的参与者有车辆、摩托车、自行车、行人、锥桶等。

广义上来讲还包括人行横道、红绿灯、道路限速等地图静态元素，Motion Planning 需要针对不同的元素做出不同的决策。

障碍物统一建模可以简化问题，并且提升计算效率。

Aopllo 将所有交通参与者抽象为 Static Obstacle，Dynamic Obstacle 和 Virtual Obstacle，Obstacle 就是 box， Static Obstacle 和 Dynamic Obstacle 为车辆、行人等， Virtual Obstacle 为人行横道、禁停区等。路径规划时不考虑 Virtual Obstacle。
使用能量场相关的方法，将交通参与者使用能量函数表示。上图中间图就是清华 [4] 提出的行车安全场，由静止物体的势能场、运动物体的动能场和驾驶员的行为场构成。最优轨迹就是寻找一条能量和最小的轨迹。
论文 [5] 将交通参与者分为 obstacle-like 和 constraint-like。obstacle-like 是动静态车辆、红灯等，将其映射到 slt 的 3D 栅格中。constraint-like 是限速、停车标志等，作为 semantic boundary。根据决策序列动作在 slt 配置空间内生成若干 cube 边界供轨迹生成使用。

2.2.3 场景认知推理

由于现实中环境的复杂性，一种决策策略或者规划方法难以处理不同的工况。

因此对行驶环境进行分类，在不同的场景下选择不同的策略可以提升 Motion Planning 的性能。

那么怎么进行场景分类和场景识别，在不同的场景 Motion Planning 又该有哪些不同？这些问题都是需要解决的。

Aopllo 中场景分类为 LANE_FOLLOW、SIDE_PASS、STOP_SIGN_UNPROTECTED 等。有两种场景识别方式，一是通过规则的方法，一是通过机器学习的方法。不同的 scenario 有不同的 stage，stage 中依次执行 task。即使是相同的 task 在不同 scenario 中参数配置也可能不同。
毫末基于城市场景路口多、拥堵多和变道多的特点，将行驶场景分为十类，显然是和 Apollo 中的 scenario 分类是不同的，然而毫末的场景识别方法却不得而知。毫末此外还提出了行驶环境熵的概念来描述行驶环境的拥堵状态。

2.3

不确定性

2.3.1 定位不确定性

在多数的 Motion Planning 中都是认为定位是足够准确的，但是实际场景中由于遮挡、多径干涉等问题，定位往往是不准确的。

以论文 [6] 中的左下图所示，由于定位误差导致从 HD Map 模块查询到的道路边界产生误差，从而使规划和车辆行驶轨迹在道路边界上。

论文将定位不确定性假设为高斯分布，并且定位模块可以计算出概率分布的期望与方差。

论文将车辆坐标系转换到了 UTM 坐标系下，根据定位的高速分布情况和坐标变换公式，就可以计算出车辆周围环境在定位影响下的不确定性，如上右图所示，其中颜色越深表示不确定性越大，其不确定性计算公式主要由下式得到。

可以发现距离 ADC 越远其不确定越高，随着车辆的前进，其不确定性会被更新。

路径规划方法采用了 Lattice（五次多项式曲线）的方法，在 cost 计算时，增加了两个项目。

一个是硬约束：规划路径上点的最大不确定性不能大于某一个阈值；

一个是在 cost function 中增加了不确定性的权重和。

2.3.2 感知不确定性

由于传感器噪声、车辆震动、行驶环境和不完善的算法，感知得到结果具有不确定性，甚至是错误的。

由于感知的不确定性会造成 Motion Planning 结果的不安全性。

一种简单的处理方式是加 buffer，但是粗暴的处理方式会减小 Motion Planning 的可行域，可能造成过于激进或者过于保守的行驶策略。

论文 [7] 以装备了 Around View Monitoring ( AVM ) 的泊车应用为例，由于感知误差会使路径规划在实际超车位置停车，可能会发生碰撞，如下左图所示。

论文将感知的不确定性建模为高斯分布，感知效果距离 ADC 越远不确定性越高，如下右图所示。

论文中整体架构如下左图所示论文，采用此算法后的效果如下右图所示。

Parking space sampling：对距离 ADC 最近的两个角点进行采样，将采样点看作是正态分布的，根据采样角点和设定的停空间的长度，计算 ADC 后轴中心的停车点；
Path candidate generation：采用 ocp 理论对每个采样点进行路径规划，其中将时域问题转化为 Ferent 坐标系下，并使用 SQP 求解非线性问题；
Optimal Path Selection：使用 utility theory 进行最优路径的选择。Utility function 为：EU(s) = P(s) x Uideal(s) +(1-P(s)) x Ureal(s)，其中 P(s) 为路径对应采样点的概率，Uideal 为路径到目标点(当前时刻感知检测到的，并非采样得到的)的偏差效用函数值， Ureal 为路径上到 ADC 当前位置的效用函数值。

2.3.3 预测不确定性

预测是实现 L4 以上高级别自动驾驶的重要环节。然而截至目前，预测对整个行业来说仍是一个非常难的问题。因此预测的准确性很差，在不确定性预测结果下做 Motion Planning 是非常重要的。

论文 [8] 提出了一个基于高斯分布的规划架构，处理预测和控制不确定性带来的规划轨迹不安全的问题。

候选轨迹生成：通过多阶段横纵向采样生成。可以理解为 Aopllo Lattice 方法。
预测轨迹生成：对于某一个车辆的轨迹进行预测(进行规划)时，认为其他车辆是匀速行驶的，并且其状态都是确定的，则通过对候选轨迹的 cost 计算，得到最优的预测轨迹。之后通过卡尔曼滤波计算预测轨迹的概率分布，并假设其遵从正态分布。
ADC 轨迹生成：此时需要考虑其他交通参与者的预测的不确定性。针对每一条候选轨迹，通过 LQR 算法计算出控制误差，然后再通过卡尔曼滤波计算出轨迹的概率分布，在轨迹评价进行 cos 计算时，碰撞检测是基于预测和 ADC 规划轨迹的概率分布的，即在所有概率分布内都不能发生碰撞。

作者认为此方法相当于给 box 加上一个自适应的 buffer，而常规的固定大小的 buffer 会导致保守或者激进的驾驶行为。

论文 [9] 论文提出了一种可以嵌入现有 Motion Planning 框架的 fail-safe 机制，分为三部分：

Set-based prediction：根据制定的交通参与者的驾驶策略和车辆运动学模型，将原有的交通参与者单一的预测轨迹，改为多预测轨迹；
Fail-safe trajectory：根据预测的结果，计算原 planning trajectory 有碰撞风险的第一个轨迹点，然后再根据最优化理论生成轨迹；
Online verification：将 ADC 在第二步生成的轨迹上进行投影，判断其是否和第一步的预测车辆轨迹是否有碰撞。

感觉此方法是又重新做了一遍 Motion Planning，由于论文中没有描述 fail-safe trajectory 是否考虑 decision 的结果，可能会造成 safe trajectory 不满足 decision 结果，并且此论文只是仿真，并没有实际应用。

2.3.4 Partially Observable Environments

由于传感器自身的感知范围受限和感知结果的不确定性，在不良光照或者恶劣天气中会进一步放大。

而在城市工况中，建筑物的遮挡会造成不完全感知，如下图所示。

此外，大型车辆也会造成感知遮挡问题，而多数的 Motion Planning 都是以完全感知进行处理的，规划结果具有很大的不安全性。

论文 [10] 提出了一种处理不完全感知的安全的 Motion Planning，使规划轨迹在最危险情况下可以在车辆最大制动能力下安全停车而不发生碰撞。分为两种情况：

一是在直道上行驶考虑感知的不确定性和感知距离范围；

二是在城市十字路口考虑不完全感知情况。

并且容易嵌入其他的 Motion Planning 架构中，作者在其之前提出基于最优化方法的轨迹规划中进行了仿真验证(综述中的图(b))。

作者为其理论设计了几个假设：

定位的纵向位置和速度信息遵从高斯分布；
感知的有效范围是已知的，并且感知的结果遵从高斯分布；
地图信息中包含建筑物位置，且为凸多边形；
使用 Intelligent Driver Model ( IDM ) 进行车辆加速度预测。

由于论文分直道和十字路口两种情况处理，因此需要进行场景识别，论文采用了基于规则的方式进行场景识别。

上面左图：红色虚线是感知观测到的环境的时间，黑色虚线是进行 Motion Planning 的时间，可见 Motion Planning 使用的感知信息是 tp 时刻前的。此外由于 Motion Planning 要保证连续性，在 Motion Planning 计算周期 tpin 时间内的规划轨迹要保证一致。更重要的是由于执行器的延迟，在 tsafe 时间内要保证轨迹的安全性。论文中 tsafe= 2tpin；
上面中图：在直道行驶分为感知范围内没有车辆或者感知范围内有车辆两种情况：一是感知范围内没有车辆，假设驾驶感知范围外有一个静止车辆，将其设为虚拟静止障碍物，通过其高斯分布特性可以计算得到 tsafe 时刻内，满足以最大制动能力刹车的纵向位移和速度约束；二是感知范围内有车辆，考虑感知不确定性情况下的最危险情况，即前车以最大制动能力刹车，通过其高斯分布特性可以计算得到 tsafe 时刻内，满足以最大制动能力刹车的纵向位移和速度约束；
上面右图：在十字路口行驶，根据 IDM 模型计算 ADC 是需要让行还是有路权需要明确表明表明自己优先通过的意图。最后转换为直道行驶的两种类型的约束。

2.4

Single Agent

Single Agent 认为是单智能体问题，即 ADC 会对周围环境做出决策，而不考虑 ADC 行为决策对其他交通参与者的影响，显然这种假设是不对的，但是却简化了 Motion Planning 问题。

行为决策是影响自动驾驶发展的另一个重要方面，随着自动驾驶的等级越高，行为决策的重要性越高。

行为决策的难点是如何体现自动驾驶车辆的智能性，如何使自动驾驶车辆可以像人类驾驶员一样处理高维度、多约束的复杂场景，甚至要比人类驾驶员的表现更好。

目前多数方法是基于规则的方法，其能力有限。

以基于规则方法的行为决策来说，在下匝道工况，一般会设计一个距离匝道口的距离阈值。当 ADC 到匝道口的距离在阈值内时，就开始向最右侧车道变道。

假设这个阈值是 2km，如果 ADC 在匝道口 2.1m 处位于中间车道行驶，此时前方刚好有辆车且速度较低，基于规则的行为决策一般会选择向左侧车道变道(左侧车道限速高，超车遵从左侧超车，从小鹏 NGP 等可以看出也是左侧车道优先)。但是变道后距离匝道口的距离阈值小于 2km，此时需要向最右侧车道变道，需要连续进行二次变道，会显得不够智能。

再比如在匝道前 500m 最右侧车道行驶，前方由于施工或者事故不能行驶，此时只能由驾驶员接管。由此可见，由于现实工况的复杂性，基于规则的行为决策方式很难做到良好的驾乘体验。

港科大关于 OPMDP [11] 的行为决策工作，相比于基于规则的方法，性能有了一定提升，其对 ADC 和其他交通参与者的行为进行了剪枝，降低了 OPMDP 的耗时。但是其考虑了其他交通参与者会对 ADC 的行为进行规避等，可以看出是一个 Multiple Agent 问题来处理。

2.5

Multiple Agent

上述的 Single Agent 中认为交通参与者不会对 ADC 的行为做出相应的决策。

但实际中，当 ADC 做出决策后，其行为会影响到其他交通参与者的行为，而使原有的预测结果的可信性降低，尤其是有些简单基于规则的 prediction 不依赖于 Motion Planning 结果，或者使用上一帧 Motion Planning 的结果 ( Apollo ) 。

例如在下图左图中，当 ADC L 沿着 trajectory1 行驶时，A2 可能会减速避让。当ADC L 沿着 trajectory2 行驶时，A2 可能会加速通过路口。但是当 ADC L 沿着 trajectory2 行驶时，预测 A2 可能会加速通过路口，但是 A2 可能会理解错 ADC L 的意图进行减速，会造成两辆车锁死。

因此 ADC 怎么理解其他交通参与者的意图和怎么让其他交通车理解 ADC 的意图至关重要 [12]。

2.6

工程化问题

在 Motion Planning 中还面临一些工程化问题，主要包括如下几个方面。

实时性：在第一个问题中提到的了最优性问题，如果要解决，由于在三维空间搜索计算的复杂性，其实时性很难保证，这也是限制时空联合规划应用的一个原因。此外最优化算法中的大规模约束和非线性也面临实时性的挑战。
完备性：插值、Lattice 等算法是概率完备的，尤其在复杂多障碍物环境中，有限的采样很难获得无碰撞的轨迹。而最优化方法由于数值求解，也不能达到完备性，常用的 osqp 求解器甚至会给出一个错误的解。
难量化性：Motion Planning 中的评价指标多是主观性的，比如舒适性和通过性等，很难量化评价。不同工程师调参得到体感不同，又与乘客的主观感受不同。因此提出了机器学习的方法来学习 Motion Planning 中的参数或者变道策略。

PART.

行业解决方案

针对上述问题与挑战，行业内公司也在积极探索并提出了一些解决方案，下面列举一二。

轻舟智航采用了时空联合规划解决最优性问题，提高规划性能，并且自研了非线性规划器高效求解 [2]。
图森未来新一代框架中，感知模块在提供障碍物位置、速度等信息时，同时提供不确定性或者概率信息，以保证决策规划可以提前做出安全舒适的决策 [13]。
特斯拉将 planner 用于交通参与者的其他车辆。但与其他车辆交互时，不能只为 ADC 规划，而是要为所有交通参与者共同规划，针对整体场景的交通流进行优化。为了做到这一点，会为场景中的每个参与对象都运行 autopilot 规划器。除此之外，针对停车场景，采用 A* 搜索算法和神经网络结合策略，大大减少了 A* 算法的节点探索 [15]。
小鹏和特斯拉针对车道线缺失，道路拓扑变化问题做了优化 [14]。
Waymo 提出了 ChauffeurNet 用于提升决策性能 [16]，Apollo 借鉴 ChauffeurNet 提出了自己的强化学习架构 [17]。

正文 END

来源 | CSDN

作者 | 小作坊钳工

编辑 | 六耳

参考文献

[1] D. González, J. Pérez, V. Milanés and F. Nashashibi, "A Review of Motion Planning Techniques for Automated Vehicles," in IEEE Transactions on Intelligent Transportation Systems, vol. 17, no. 4, pp. 1135-1145, April 2016, doi: 10.1109/TITS.2015.2498841.

[2] 扬奇直播课堂：《自动驾驶中的决策规划技术》轻舟智航

[3] 自动驾驶中轨迹规划的探索和挑战

[4] 基于动态行车安全场的智能网联汽车决策规划方法研究

[5] W. Ding, L. Zhang, J. Chen and S. Shen, "Safe Trajectory Generation for Complex Urban Environments Using Spatio-Temporal Semantic Corridor," in IEEE Robotics and Automation Letters, vol. 4, no. 3, pp. 2997-3004, July 2019, doi: 10.1109/LRA.2019.2923954.

[6] Artunedo, Antonio, et al. "Motion planning approach considering localization uncertainty." IEEE Transactions on Vehicular Technology 69.6 (2020): 5983-5994.

[7] Lee, Seongjin, Wonteak Lim, and Myoungho Sunwoo. "Robust parking path planning with error-adaptive sampling under perception uncertainty." Sensors 20.12 (2020): 3560.

[8] W. Xu, J. Pan, J. Wei and J. M. Dolan, "Motion planning under uncertainty for on-road autonomous driving," 2014 IEEE International Conference on Robotics and Automation (ICRA), 2014, pp. 2507-2512, doi: 10.1109/ICRA.2014.6907209.

[9] Pek, Markus Koschi Christian and Matthias Althoff. “An Online Verification Framework for Motion Planning of Self-driving Vehicles with Safety Guarantees.” (2019).

[10] Ö. Ş. Taş and C. Stiller, "Limited Visibility and Uncertainty Aware Motion Planning for Automated Driving," 2018 IEEE Intelligent Vehicles Symposium (IV), 2018, pp. 1171-1178, doi: 10.1109/IVS.2018.8500369.

[11] L. Zhang, W. Ding, J. Chen and S. Shen, "Efficient Uncertainty-aware Decision-making for Automated Driving Using Guided Branching," 2020 IEEE International Conference on Robotics and Automation (ICRA), 2020, pp. 3291-3297, doi: 10.1109/ICRA40945.2020.9197302.

[12] Autonomous vehicles' intended cooperative motion planning for unprotected turning at intersections

[13] 图森未来在重卡自动驾驶的最新落地与实践 | 王乃岩

[14] 重新定义 LCC？城市道路小鹏 P5 辅助驾驶VS 特斯拉 Model 3

[15] Tesla AI Day 2021完整视频

[16] ChauffeurNet Learning to Drive by Imitating the Best and Synthesizing the Worst

[17] Apollo决策规划强化学习

往期回顾

最新SOTA！SSL-Lanes：首篇运动预测中的自监督学习范式

【自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区，聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向；

加入我们：自动驾驶之心技术交流群汇总！

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知（分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测）、自动驾驶定位建图（SLAM、高精地图）、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布，欢迎扫描下方二维码，加入自动驾驶之心知识星球（三天内无条件退款），日常分享论文+代码，这里汇聚行业和学术界大佬，前沿技术方向尽在掌握中，期待交流！