Apollo课程学习6——控制

最新推荐文章于 2025-04-17 14:45:50 发布

Albert

最新推荐文章于 2025-04-17 14:45:50 发布

阅读量1.6k

点赞数 3

分类专栏： Apollo课程学习

本文链接：https://blog.csdn.net/weixin_43476492/article/details/107980843

版权

Apollo课程学习专栏收录该内容

9 篇文章

订阅专栏

本文深入探讨了Apollo自动驾驶系统中的控制原理与方法，包括控制模块的输入输出、控制作用及性能要求，介绍了基于模型的控制方法，如建模、系统辨识、控制器设计与参数调优，并详细讲解了PID控制、LQR、MPC等控制策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学习前言

今天的学习内容是控制原理与方法。

控制概述

一、控制的输入输出

下图是Apollo自动驾驶框架的基本结构：

从图中可以看出，控制模块的输入一方面来自planning（规划模块），另一方面来自反馈阶段信息（如localization和HD Map），此部分信息包括车辆位置、朝向、速度等。

其输出结果是控制指令，与下层模块canbus（车辆交互标准）进行交互；同时控制模块也会从底层车辆得到反馈信号（车辆本身in vehicle reference frame：速度信息、四轮转速信息、车辆健康状况信息、底盘是否报错信息、危险信息）

二、控制模块

如下图所示，控制模块包括三个部分：预处理、控制器和后处理。

其中，预处理部分的主要功能：

控制器主要功能：

后处理部分功能：

三、控制的作用

控制主要是为了弥补数学模型和物理世界执行之间的不一致性。对于自动驾驶而言，规划的轨迹和车辆的实际运行轨迹并不完全一致，控制器按照规划轨迹在条件允许下尽可能地调节车辆本身。

四、控制的性能要求

准确性，应尽量避免偏离目标轨迹，保证行车的安全性。
可行性，在现实中要能够实现。
平稳度，最大限度地提供乘客的舒适度。要使控制顺利进行，驱动必须是连续的，应避免突然转向、加速或制动。

控制是驱使车辆前行的策略。控制器使用一系列路径点来接收轨迹。并使用控制输入（转向、加速和制动等）让车辆通过这些路径点。

具体而言，自动驾驶系统是否满足性能要求可以从三个角度去评测：时域、频域以及discrete domain（离散域）。

时域是指输出在时间轴上应该满足的要求。其衡量的指标包括steady state gain、rising time、setting time、overshoot和undershoot。每个指标对应的具体含义如下图所示。

在频域空间，X轴是输入频率，Y轴是输出跟输入的比例，理想状态下输出和输入比例应该为1。系统性能在频域中的评价指标包括pass band、cutoff frequency等，如下图所示。

时域和频域的相互关系：

满足系统性能要求的额外考量指标：

基于模型的控制方法

一、建模

Modeling一般可以分为分析建模和拟合建模。通常，一个模型主要由各种属性表示，如下图所示：

控制模块中的模型，通常包括运动学模型和动力学模型。

运动学模型是一种几何模型，感知、预测讨论的模型则以运动学模型为主。
而在控制模块中，更多考虑动力学模型。实际上，运动学模型是动力学模型的一个子集。

在自动驾驶中，Dynamic model以Kinematics model为初始模型，将环境等参数设置到Kinematics model中，把车看作质点进行分析。Dynamic model 将车按车轮等部分分开进行约束或者系统补偿。

两个比较简单的几何模型：下图左边是一个综合移动机器人控制模型，右边是著名的自行车模型，它把汽车看作只有两个轮胎的自行车，该模型在当年的DARPA挑战赛上获得冠军。

实际上，只考虑几何约束是不够的。下图是一个动力学模型，它不仅考虑了几何约束，还考虑了力矩和扭矩平衡。在自行车模型中，把前后轮都在XY两个方向进行分解。

下图是刚体的一些力矩分析以及扭矩分析的公式，总体满足牛顿第二定律。

在假设纵向速度为0的情况下，对横向方程进行线性化：

通常情况下，模型的建立是基于误差，而不是参考值，如下图所示，对实际侧向加速度和理想侧向加速度之间的误差进行建模。

二、系统辨识

在模型中，有些参数是未知的，系统辨识的目的是确定这些未知参数的值。确定未知参数的方法有三种：白盒、灰盒以及黑盒方法。

三、控制器设计

基于模型的控制模块设计第三步是控制器的设计，包括滤波器设计、控制器设计以及观察器设计等。

1、滤波器设计

滤波器的分类：

2、控制器设计

控制器的类型大致可以分为三类，分别是开环控制、前馈环控制和后馈环控制，如下图所示。

前馈环控制器可以分为两类，如下图所示：

上图是增加一个H（前置滤波器），把输入转化为理想的输入。
下图是把扰动量加入到前馈环中，将模型的先验知识添加到环路，减少扰动的影响。

前馈环控制器的主要控制策略：

设计控制器首先要考虑可控性和可观性：

控制器设计还要考虑Deadzone、饱和和抗饱和等。

Deadzone主要是执行器的一些特性引起的，例如汽车的油门，可能给油0%～15%的区间都不会使汽车前行，这个时候反应在图上就是一条平行的线段，即Deadzone。在控制器设计的时候需要对这部分进行补偿设计，如下图所示：

饱和和抗饱和处理也是出于对执行器的特性的考虑，通常一个执行器是有上限和下限的，如下图所示，把输出值做一个限制，使得输出在执行器的上下限范围内。如果不进行饱和处理，在输出100%的情况下突然转换状态，收敛到最终值可能需要很长的时间。

控制器的发展趋势：

四、参数调优

1、PID控制

P（比例Proportional)：P控制器在车辆开始偏离时立即将其拉回目标轨迹。车辆偏离越远，控制器越难将其拉回目标轨迹。当kp比较小的时候，接近终值的速度会非常慢，没有超调（红线）；当kp设置比较大时（紫线），则达到稳态速度变快，但会超调。

D（微分Derivative）：增加了一个阻尼项，可最大限度地减少控制器输出的变化速度，使运动处于稳定状态。微分控制的目的是使系统更快的从瞬态转化为稳态。

I（积分Integral）：控制器会对系统的累积误差进行惩罚，负责纠正车辆的任何系统性偏差（如转向失准）。如果系统中存在损耗，比如汽车上坡的动力或者摩擦损耗，使得比例控制每次增加的控制量就等于或者小于损耗时，出现稳态误差，这就是引入积分控制的目的，它可以将之前的误差进行积分，消除稳态误差。

系统的控制量就是P+I+D三项的和。