百度Apollo决策技术分享

何伯特

已于 2022-03-29 17:34:17 修改

阅读量6.5k

点赞数 14

分类专栏：机器人决策与运动规划文章标签： apollo 决策自动驾驶

于 2019-03-27 13:31:01 首次发布

本文链接：https://blog.csdn.net/weixin_43795921/article/details/88842480

版权

机器人决策与运动规划专栏收录该内容

39 篇文章 121 订阅

订阅专栏

本文是根据Apollo开发者社区在3月26日举办的“Apollo决策技术分享”在线图文直播课程的授课内容整理而得。

决策模块相当于无人驾驶系统的大脑，保障无人车的行车安全，同时也要理解和遵守交通规则。
为了实现这样的功能，决策模块为无人车提供了各种的限制信息包括：

1.路径的长度以及左右边界限制；
2.路径上的速度限制；
3.时间上的位置限制。

此外，决策模块几乎利用了所有和无人驾驶相关的环境信息，包括：

1.Routing 信息；
2.道路结构，比如当前车道，相邻车道，汇入车道，路口等信息；
3.交通信号和标示，比如红绿灯，人行横道，Stop Sign，Keep Clear 等；
4.障碍物状态信息，比如障碍物类型，大小，和速度；
5.障碍物预测信息，比如障碍物未来可能的运动轨迹。

正是因为决策模块处理了所有上层业务逻辑信息，并输出了抽象的限制信息，我们保证了下游路径和速度优化的抽象性，并完全和上层的地图，感知，预测的解耦。

参考路径（Reference Line）在 Apollo 决策中起着非常重要和关键的作用。

1.首先，参考路径是在没有障碍物路况下的默认行车路径；
2.其次，后续的交规决策，路径决策，和速度决策都是基于参考路径或者参考路径下的 Frenet Frame 完成的；
3.最后，参考路径也用于表达换道的需求，一般换道时会有两条参考路径，分别有不同的优先级。

其中，优先级高的路径表示目标路径，优先级低的路径为当前路径（如右图所示）。
参考路径的获取可以有多种方式。
在 Apollo 里，参考路径的计算是根据 routing 的线路，找到相应的高精地图中的道路中心线，然后进行平滑。
有了参考路径之后，我们会沿着该路径找到所有在该路径上的交通标示和交通信号灯，并根据一系列的交通规则来决定是否在需要停止在交通标示或者交通信号灯的停止线前。

如果需要停止，决策模块会在停止线上生成一个虚拟的墙。虚拟墙会影响后续的路径及速度决策。
如果是红灯，决策模块会在交通灯的停止线上生成一道虚拟的墙。
如果是绿灯，不生成任何虚拟墙。这样我们就完成了绿灯行红灯停的交通规则。
其他的交通规则也采取类似的方法，根据规则决定是否在相应的地方放置虚拟墙。

有了根据交通标示和交通信号灯产生的虚拟墙，再加上从感知模块得到的障碍物信息，我们就可以开始进行路径决策。路径决策的过程类似于上图中的决策树。
首先我们判断是否需要进行换道（Lane Change）。
如果我们有多条参考路径并且当前车辆不在优先级最高的参考路径上，则表明需要进行换道，否则为不需要换道。在明确换道的情况下，我们需要判断当前路况是否可以进行安全换道。
如果安全，路径决策会产生换道的路径边界，否则产生车道内的路径边界。
如果我们确定当前没有换道需求，路径决策会继续确定是否需要借道避让（Side Pass）。
判断条件主要有两个：

1.当前车道的可行驶宽度不够；
2.前方障碍物为静止状态且不是由于车流原因静止。比如，路边卸货车辆。如果确定需要借道避让，路径决策会判断是否可以安全借道。如果安全，路径决策会产生街道避让的路径边界，否则产生车道内的路径边界。

如果我们确定没有借道避让的需求，路径决策会产生车道内的路径边界。

车道内路径边界的决策有图中所示的三种情况：

车道内无障碍物，车道前方有障碍物，车道左右方有障碍物。

实际路况中会是其中的一种情况或者多种情况的组合。

1.在无障碍物的情况下（左图），路径边界依据车道边界或者道路边界来生成，并留有一定距离的缓冲（绿色虚线）；
2.在前方有障碍物的情况下（中图），路径边界会被截止在第一个障碍物的后方；
3.如果车道左右方有障碍物（右图），路径边界的产生会依据车道线和障碍物的边界。

图中的蓝色线是车辆的参考路径（Reference Line），路径边界的生成是在参考路径的 Frenet Frame 下完成的。

借道避让的路径边界产生，是在确认可以安全借道之后完成的。
而是否可以安全借道的决策，目前是根据一系列的规则来做出的，这个决策也可以依据 ST图或者数据模型来生成。
如上图所示，路径的边界是依据本车道和需要借用车道的边界来生成，同时也需要考虑周围的障碍物。

换道路径边界的产生和借道避让相似（如上图所示），主要的区别是 Reference Line（参考线）在换道时是在目标车道上，而借道避让时是在本车道上。
另外需要强调的是，在做路径决策时，我们只考虑静止障碍物。动态障碍物是在速度规划时考虑。

有了路径边界后，我们调用路径优化器（Path Optimizer）得到在边界限制内的平滑路径。
得到平滑的路径后，我们就可以在路径上进行速度决策。速度决策的流程如上图所示。

1.我们首先对一整条路径或者部分路径产生一个或者多个速度限制边界（Path Bounds）；
2.然后对多个速度边界进行集成，得到最终的路径上的速度限制边界（Speed Bound Over s）；
3.得到速度限制之后，我们在利用 ST 图来得到时间上的位置限制边界（Position Bound Over t）；
4.最后我们把速度边界和位置边界传给速度优化器（Speed Optimizer）得到平滑的速度规划。

我们在很多情况下，出于行车安全或者遵守交规的原因，需要对车辆的速度进行限制。比如，当路径旁边有行人时，我们要减速慢行；当我们要借道避让时，也要减速慢行。
这样的速度限制可能是对整条路径，比如道路限速，也有可能是对路径中的一小段，比如减速带。
如图右上所示，沿路径（s）有三种不同的速度限制：

道路限速（黄色），减速带（红色），和行人（绿色）。

为了得到整条路径的综合限速，我们把这几种限速集成到一起，如图右下所示。

得到了路径上的速度边界后，我们就可以利用 ST 图来求解时间上的位置边界。上图是一个简单的 ST 图的例子，我们用这个例子来简单解释我们为什么需要 ST 图以及如何从 ST 图上得到时间上的位置边界。
图左是一个简单的驾驶场景，右侧灰色方框代表自动驾驶主车，蓝线是主车的路径；左侧黑色方框代表障碍车，红线是障碍车的预测行驶轨迹。
把障碍车的预测轨迹和主车的路径的交汇关系在 ST 图中表示出来，就如图右所示。

t1 为障碍车预测轨迹和主车路径的交汇时间； s1，s2 为交汇时障碍车在主车路径上的位置； s1 代表车尾位置，s2 代表车头位置。

在 ST 图中，我们的目标是找到一条不和障碍物碰撞的曲线。同时，曲线还需要满足我们之前计算的路径上的速度限制，即曲线的斜率不能超过 v 的限制边界（图右上）。找到最优的一条曲线后，我们根据曲线计算时间上的位置限制边界。
例如，如果我们找到红色的曲线为最优曲线，时间上的位置限制就为红虚线段。在 x，y 平面中，就表现为主车在障碍车换道前进行超车。反之，绿色的曲线和绿色虚线段表示主车在障碍车换道后，进行跟随。

有了路径上的速度限制，及时间上的位置限制之后，我们就可以把这两个决策传递给速度优化器得到平滑的速度规划，即在路径上的每个点的时间。
生成速度规划后，我们就可以结合路径和速度生成最终的 Planning 的轨迹。
以上就是 Apollo 决策的一些基本设计和实现。

关于“场景”的概念是在 Apollo3.5 中首次提出，一个场景既可以是地图中的一个静态路段，比如十字路口；也可以是无人车想要完成的一个动态目标，比如借道避让（Side Pass）。
依据场景来做决策和规划有以下两个优点：

1.场景之间互不干扰，有利于并行开发和独立调参；
2.在一个场景里我们可以实现一系列的有时序或者依赖关系的复杂任务。这样的场景架构也有利于开发者贡献自己的特有场景，并不影响其他开发者需要的功能。

同时场景架构也带来了一些难点：

1.首先，场景的通用部分会带来代码的冗余，不便于代码的升级维护；
2.其次，场景的划分，尤其是保证场景之间没有功能上的覆盖也很困难；
3.最后，有了多个场景之后，需要额外的逻辑来进行场景识别以及处理场景之间的转换。

场景的划分其实没有特别严格的规定，同时这也取决于自动驾驶的应用场景，比如送货小车和高速卡车在场景的划分上肯定不太一样。上图中，给出了 Apollo 场景分类的一个例子，来尽量保证每个场景之间相对独立。
我们把场景分为两大类，Lane Follow 和 Lane Breaking：

1.Lane Follow 场景下主车沿一条车道驾驶，该车道前方一定距离内没有其他车道与其交汇或者穿越；并且主车也没有切换到其他车道的意图；
2.非 Lane follow 的其他场景被分类为 Lane Breaking。

在 Lane Breaking 下，我们又细分为三个小类：

1.Intersection 是所有的路口场景；
2.Active Pass 包括了所有临时借道的场景；
3.Lane Switch 包括了所有换道的场景（包括车道合并）。

有了场景的分类之后，我们就可以对场景进行识别和转换。对于选择哪个场景，我们采用了两层的识别机制。
首先，每一个场景自己会根据当前的环境信息，确定是否属于自己的场景，并返回该信息给场景管理器，场景管理器再统一进行选择，以保证场景的选择最优。
场景的退出也由每个场景自己决定，比如场景运行完成或者内部出错。一旦进入一个场景，该场景会有较高优先级来完成。

用借道避让场景的一个实现，来说明场景是如何实现的。
在这个场景中，我们有 6 个 Stage（阶段），每个 Stage 完成借道避让的一个步骤，类似于有限状态机中的一个状态。主要步骤/状态有一定的时序依赖关系，如果在一个 Stage（阶段）中发现环境变化了，或者出现错误，会出现 Stage 之间的跳转或者退出该场景。

在每一个 Stage（阶段）中，都要实现上图中的功能，包括交规决策、路径决策、路径优化、速度决策、速度优化。
我们把每个功能定义为一个或者几个基本的 Task（任务），每个 Stage（阶段）或者直接调用（使用默认参数），或者修改参数，或者修改输入值。这样的实现可以极大的提高场景之间的代码复用。

在上述的 Apollo 决策的实现中，我们使用了路径和速度分离的方法。这样的实现极大的简化了决策和优化问题，但是同时也使得最终轨迹不一定是最优的。
我们同时也在探索一些方法，使得路径和速度的决策和优化能够关联起来。