MPC（1）线性时变模型预测控制

最新推荐文章于 2025-05-04 02:23:12 发布

碎步の流年

最新推荐文章于 2025-05-04 02:23:12 发布

阅读量8.3k

点赞数 4

分类专栏：控制

本文链接：https://blog.csdn.net/qq_24649627/article/details/102799698

版权

控制专栏收录该内容

9 篇文章

订阅专栏

本文深入探讨了线性时变模型预测控制算法在无人驾驶车辆中的应用，详细介绍了预测方程的构建、优化求解及滚动优化策略。通过矩阵运算简化计算，确保实时性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前段时间在做无人驾驶车辆模型预测控制这方面的开发，已经在Matlab/CarSim中验证过相关的算法可行性，现在对之前的工作做一个简单的记录。实际控制和理论方面还是有很大差距的，这里仅仅是参考而已。
这本书《无人驾驶模型预测控制》很有参考价值，以下几篇内容均是其中比较精华的部分摘取，有些会加上个人的一看见解，若有不当之处，劳烦指出。

线性时变模型预测控制算法是以线性时变模型做为预测模型，目前在模型预测领域应用最广的一种形式。相比非线性模型预测控制，其最大的优点就是计算较为简单，从而保证了良好的实时性。
MPC控制原理框图

预测方程

首先，采用以下离散线性化模型：
$x(k+1)=A_{k,t}x(k)+B(k,t)u(k) \tag{1}$
式中，x为状态量，u为控制量。
令
$\xi(k\vert t)=\begin{bmatrix} x(k \vert t) \\ u(k-1 \vert t) \\ \end{bmatrix} \tag{2}$

则可以得到一个新的状态空间表达式：
$\xi(k+1 \vert t) = \widetilde{A}_{k,t}\xi(k \vert t)+\widetilde{B}_{k,t}\Delta u(k \vert t) \tag{3}$
$\eta(k \vert t)=\widetilde{C}_{k,t}\xi(k \vert t) \tag{4}$

式中各个矩阵的定义如下，
$\widetilde{A}_{k,t}=\begin{bmatrix} A_{k,t} & B_{k,t} \\ 0_{m*n} & I_m \\ \end{bmatrix} \tag{5}$
$\widetilde{B}_{k,t}=\begin{bmatrix} B_{k,t} \\ I_m \\ \end{bmatrix} \tag{6}$
$\widetilde{C}_{k,t}=[C_{k,t}\space0] \tag{7}$

为了进一步简化计算，做出以下假设：
$\widetilde{A}_{k,t}=\widetilde{A}_{t},k=1,...,t+N-1 \tag{8}$
$\widetilde{B}_{k,t}=\widetilde{B}_{t},k=1,...,t+N-1 \tag{9}$

假设系统的预测时域Np，控制时域Nc，此时预测时域内的状态量和系统输出量可以按下下式计算：
$\xi(t+N_p|t)= \widetilde{A}^{N_p}_{t}\xi(t|t)+\widetilde{A}^{N_p-1}_{t}\widetilde{B}_{t}\Delta u(t|t)+\\ ...+\widetilde{A}^{N_p-N_c-1}_{t}\widetilde{B}_{t}\Delta u(t+N_c|t) \tag{10}$
$\eta(t+N_p|t)=\widetilde{C}_{t,t}\widetilde{A}^{N_p}_{t,t}\xi(t|t)+\widetilde{C}_{t}\widetilde{A}^{N_p-1}_{t}\widetilde{B}_{t}\Delta u(t|t)+ \\ ...+\widetilde{C}_{t}\widetilde{A}^{N_p-N_c-1}_{t}\widetilde{B}_{t}\Delta u(t+N_c|t) \tag{11}$

将系统未来输出时刻的输出以矩阵的形式表达：
$Y(t)=\Psi_t\xi(t|t)+\varTheta\Delta U(t) \tag{12}$

式中：
$Y(t)=\begin{bmatrix} \eta(t+1|t) \\ \eta(t+2|t) \\ \dots \\ \eta(t+N_c|t) \\ \dots \\ \eta(t+N_p|t) \\ \end{bmatrix}$ ，
$\Psi_t=\begin{bmatrix} \tilde C_{t,t}*\tilde A_{t,t} \\ \tilde C_{t,t}*\tilde A_{t,t}^2 \\ \dots \\ \tilde C_{t,t}*\tilde A_{t,t}^{N_c} \\ \dots \\ \tilde C_{t,t}*\tilde A_{t,t}^{N_p} \\ \end{bmatrix}$ ，
$\Delta U(t)=\begin{bmatrix} \Delta u(t|t) \\ \Delta u(t+1|t) \\ \cdots \\ \Delta u(t+N_c|t) \\ \end{bmatrix}$ ,
$\varTheta_{t}= \begin{bmatrix} \tilde{C}_{t}\tilde{B}_{t} && 0 && 0 && 0 \\ \tilde{C}_{t}\tilde{A}_{t}\tilde{B}_{t} && \tilde{C}_{t}\tilde{B}_{t} && 0 && 0 \\ \cdots && \cdots && \ddots && \cdots \\ \tilde{C}_{t}\tilde{A}^{N_c - 1}_{t}\tilde{B}_{t} && \tilde{C}_{t}\tilde{A}^{N_c - 2}_{t}\tilde{B}_{t} && \cdots && \tilde{C}_{t}\tilde{B}_{t} \\ \tilde{C}_{t}\tilde{A}^{N_c}_{t}\tilde{B}_{t} && \tilde{C}_{t}\tilde{A}^{N_c - 1}_{t}\tilde{B}_{t} && \cdots && \tilde{C}_{t}\tilde{A}_{t}\tilde{B}_{t} \\ \vdots && \vdots && \ddots && \vdots \\ \tilde{C}_{t}\tilde{A}^{N_{p}-1}_{t}\tilde{B}_{t} && \tilde{C}_{t}\tilde{A}^{N_{p}-2}_{t}\tilde{B}_{t} && \cdots && \tilde{C}_{t}\tilde{A}^{N_{p} - N_{c} -1}_{t}\tilde{B}_{t} \end{bmatrix}$

由式（12）中可以清楚的看到，在预测时域内的状态量和输出量都可以通过当前的系统状态量和控制增量来计算出。

优化求解

在实际控制系统中，控制增量是未知的，此时只有通过设定合适的优化目标，根据此目标对预测方程进行求解出控制时域内的控制序列。不同的控制系统，可以根据控制器的情况设置不同的目标函数。一般，优化目标函数设置为如下形式：
$J(\xi(t),u(t-1),\Delta U(t)) \space =\space \sum\limits_{i=1}^{N_p} \begin{Vmatrix} \eta(t+i|t) \space - \eta_{ref}(t+i|t) \end{Vmatrix}_Q^2 \space + \\ \space \sum\limits_{i=1}^{N_c-1} \begin{Vmatrix} \Delta u(t+i|t) \end{Vmatrix}_R^2 \space \tag{13}$

其中第一项为预测轨迹与参考轨迹的偏差，第二项为控制量变化量的平方差，Q和R为权重矩阵。同时，也会根据实际控制系统中，控制器所能达到的控制极限做出一定的约束，
控制量约束：
$u_{min}(t+k) \space \leq \space u(t+k) \space \leq \space u_{max}(t+k) , k \space = \space 0,1,\dots,N_c-1 \tag{14}$
控制增量约束：
$\Delta u_{min}(t+k) \space \leq \space \Delta u(t+k) \space \leq \space \Delta u_{max}(t+k) ,k = 0,1,\dots,N_c-1 \tag{15}$
输出约束：
$y_{min}(t+k) \leq y(t+k) \leq y_{max}(t+k) ,k = 0,1,\dots,N_c-1 \tag{16}$
在这里插入图片描述
结合14 - 16式，求解出带约束的优化目标，可以得到未来一段时间的控制序列。

滚动优化

通过以上步骤，解算出控制时域内的一系列控制输入增量：
$\Delta U_t^* \space = \space [\Delta u_t^*,\Delta u_{t+1}^*,\dots,\Delta u_{t+N_c-1}^*]^T \tag{17}$
取第一个控制增量做为实际控制输入增量：
$\space = \space u(t-1) \space + \space \Delta u_t^* \tag{18}$
系统按照此控制量直到下一时刻t+1。t+1时刻按照此时的参考轨迹，重复以上操作，重新得到优化后的新的控制增量。如此循环直到控制过程结束。