MPC稳定性分析

weixin_46178054

已于 2022-04-22 19:28:26 修改

阅读量2.8k

点赞数 10

文章标签：算法

于 2022-04-21 16:41:51 首次发布

本文链接：https://blog.csdn.net/weixin_46178054/article/details/124325469

版权

模型预测控制无约束优化约束优化稳定性分析线性反馈

关键词由CSDN通过智能技术生成

本文详细介绍了模型预测控制（MPC）在控制系统中的应用，包括无约束MPC和约束MPC。无约束MPC通过预测未来系统行为并优化控制序列以最小化成本函数，确保系统稳定性。约束MPC则考虑了状态和控制约束，通过在预测时域末端添加等式或不等式约束来保证系统内部稳定。对于约束优化问题，文章讨论了如何通过终端等式约束或不等式约束来确保系统渐进稳定，并解释了这些方法可能带来的挑战和解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、无约束MPC

考虑如下控制系统：

$\begin{cases} x_{k+1}=Ax_k+Bu_k\\ y_k=Cx_k\\ \end{cases}$

MPC原理：根据当前系统状态预测未来系统输入及系统输出，步骤如下：

$\\ y_{k+1|k}=CAx_k+CBu_k \\ \\ \\ y_{k+2|k}=CAx_{k+1|k}+CBu_{k+1|k} \\ y_{k+3|k}=CAx_{k+2|k}+CBu_{k+2|k} \\ \vdots \\ y_{k+n|k}=CAx_{k+n-1|k}+CBu_{k+n-1|k} \\ \vdots \\ y_{k+2|k}=CAx_{k+1|k}+CBu_{k+1|k}=CA^2x_k+CABu_k+CBu_{k+1|k} \\ y_{k+3|k}=CAx_{k+2|k}+CBu_{k+2|k}=CA\left( Ax_{k+1}+Bu_{k+1} \right) +CBu_{k+2|k}=CA^2x_{k+1}+CABu_{k+1}+CBu_{k+2|k} \\ =CA^2\left( Ax_k+Bu_k \right) +CABu_{k+1}+CBu_{k+2|k}=CA^3x_k+CA^2Bu_k+CABu_{k+1}+CBu_{k+2|k}. \\ y_{k+n|k}=CA^nx_k+\sum_{i=0}^{n-1}{CA^iBu_{k+n-1-i}}=CA^nx_k+\sum_{i=0}^{n-1}{CA^{n-i-1}Bu_{k+i}} \\ Y_k=\left[ y_{k+1|k}\,\,y_{k+2|k}\,\,y_{k+3|k}\cdots y_{k+n|k} \right] ^T=\left[ \begin{array}{c} CA\\ CA^2\\ \vdots\\ CA^n\\ \end{array} \right] x_k+\left[ \begin{matrix}{l} CB& 0& 0& \cdots\\ CAB& CB& 0& \cdots\\ \vdots& \vdots& \vdots& \ddots\\ CA^{n-1}B& CA^{n-2}B& \cdots& \cdots\\ \end{matrix}\begin{array}{c} 0\\ 0\\ \vdots\\ CB\\ \end{array} \right] \left[ \begin{array}{c} u_k\\ u_{k+1|k}\\ \vdots\\ u_{k+n-1|k}\\ \end{array} \right] \\ =Fx_k+GU_k \\ \text{预测时域}\leqslant \text{控制时域成本函数}J_k=\left( Fx_k+GU_k-R_k \right) ^TQ\left( Fx_k+GU_k-R_k \right) +{U_k}^TRU_k \\ \text{无约束优化问题：}{J_k}^{'}=0\text{，}{J_k}^{''}>0 \\ \text{设成本函数：}V_k=\left( F_{p\times 1}x_k+G_{p\times p}U_k-R_k \right) ^TQ\left( F_{p\times 1}x_k+G_{p\times p}U_k-R_k \right) +{U_k}^TRU_k \\ \text{其中}Q=\mathrm{diag}\left( \xi _1 \right) ,R=\mathrm{diag}\left( \xi _2 \right) \\ \text{让}Q_f=\mathrm{diag}\left( \sqrt{\xi _1} \right) ,R_f=\mathrm{diag}\left( \sqrt{\xi _2} \right) \\ \text{得：}V_k=\left[ \left( F_{p\times 1}x_k+G_{p\times p}U_k-R_k \right) Q_f\,\,U_kR_f \right] \left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k+G_{p\times p}U_k-R_k \right)\\ R_fU_k\\ \end{array} \right] \\ \left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k+G_{p\times p}U_k-R_k \right)\\ R_fU_k\\ \end{array} \right] =\left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] U_k+\left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k-R_k \right)\\ 0\\ \end{array} \right] \\ V_k=\left( \left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] U_k+\left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k-R_k \right)\\ 0\\ \end{array} \right] \right) ^T\left( \left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] U_k+\left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k-R_k \right)\\ 0\\ \end{array} \right] \right) \\ \frac{dV_k}{dU_k}=\left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] ^T\left( \left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] U_k+\left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k-R_k \right)\\ 0\\ \end{array} \right] \right) +\left( \left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] U_k+\left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k-R_k \right)\\ 0\\ \end{array} \right] \right) ^T\left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] \\ =2\left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] ^T\left( \left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] U_k+\left[ \begin{array}{c} Q_f\left( F_{p\times 1}x_k-R_k \right)\\ 0\\ \end{array} \right] \right) \,\, \\ \frac{d^2V_k}{{dU_k}^2}=2\left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] ^T\left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] >0 \\ \text{得最优控制系列：}U_k=\left( \left[ Q_fG_{p\times p}\,\,R_f \right] \left[ \begin{array}{c} Q_fG_{p\times p}\\ R_f\\ \end{array} \right] \right) ^{-1}\left[ Q_fG_{p\times p}\,\,R_f \right] \left[ \begin{array}{c} Q_f\left( R_k-F_{p\times 1}x_k \right)\\ 0\\ \end{array} \right] \\ =\left( G_{p\times p}^{T}QG_{p\times p}+R \right) ^{-1}G_{p\times p}Q\left( R_k-F_{p\times 1}x_k \right) \\ \text{令}K_{mpc}=\left[ 1\text{，}0\cdots \,\,0 \right] \left( G_{p\times p}^{T}QG_{p\times p}+R \right) ^{-1}G_{p\times p}Q \\ \text{得到当前的控制量（即把控制系列的第一个控制量作用于系统）}u_k=K_{mpc}\left( R_k-F_{p\times 1}x_k \right) \\$

闭环状态方程

$x_{k+1}=Ax_k+BK_{mpc}\left( R_k-F_{p\times 1}x_k \right) \\ x_{k+1}=\left( A-BK_{mpc}F_{p\times 1} \right) x_k+BK_{mpc}R_k$

稳定性分析
- 单位圆法：
- 即 $|\lambda _{\max}\left( A-BK_{mpc}F_{p\times 1} \right) | <\,\,1$ 时，闭环系统是稳定的。

二、约束MPC

约束条件在实际控制系统中是无可避免的，一般表现为状态约束和控制约束。

优化问题：
$u_{k}^{*}=\underset{u_k}{\min V_k} \\ s.t.\begin{cases} u_k\epsilon \left[ u_{\min},u_{\max} \right]\\ y_k\epsilon \left[ y_{\min},y_{\max} \right]\\ \end{cases}$
对于上述的优化问题是无法求得解析解的，因此就无法跟无约束优化MPC一样得到闭环系统的表达式，显然也就不法用系统矩阵的特征值在单位圆内的方法求得闭环系统的稳定性。
稳定性讨论：Lyapunov稳定性是建立在时间无穷的基础上的。在MPC中，尽管通过每个采样时刻的优化，滚动向前优化可以使得时间趋近于无穷，但讨论MPC的稳定性问题时，每个采样时刻优化问题的的最优解并不能引出闭环系统的稳定性。原因如下：假设k时刻优化问题有最优解，记为 $\varDelta U_{k}^{*}=\left[ \begin{array}{c} \varDelta u^*\left( k|k \right)\\ \varDelta u^*\left( k+1|k \right)\\ \vdots\\ \varDelta u^*\left( k+m-1|k \right)\\ \end{array} \right]$ $\text{相应的优化目标函数值为：}J_{k}^{*}=\sum_{i=0}^p{\left\| y_{c}^{*}(k+i\mid k) \right\| _{Q_i}^{2}}+\sum_{i=0}^{m-1}{\left( \left\| \Delta u^*(k+i\mid k) \right\| _{S_i}^{2}+\parallel u(k+i\mid k)\parallel _{R_i}^{2} \right)}$ 在k+1时刻，约束优化问题也有最优解 $\varDelta U_{k+1}^{*}$ 优化值为 $J_{k+1}^{*}$
但没有保证 $J_{k+1}^{*}\leqslant J_{k}^{*}$
这样就有可能导致当 $k\longrightarrow \infty \text{时，}J_{k}^{*}\longrightarrow \infty \text{，导致}y\left( \infty \right) \longrightarrow \infty$ 因此，每个采样时刻优化问题的的最优解并不能引出闭环系统的稳定性
显然，由于约束条件的存在，一般情况下，不法得到约束优化问题的解析解，也即不能得到如无约束一样得到 $K_{mpc}$ 的表达式。因此，需要采用数值优化的方法求解约束优化问题。
约束求解问题：一般为二次规划问题(QP问题)： $\underset{z}{\min}z^THz\,\,-\,\,g^Tz\,\, , Cz\geqslant b\,\,$ 因此可以把优化问题和约束转化为标准的QP问题
无论是控制约束还是输出约束都是一种非线性特性，因此，约束预测控制的闭环系统是非线性的。
约束稳定性方法：
- 终端等式法：在预测时域的终端加一个输出的等式约束，即使系统在预测时域的终端达到稳定输出。
- 终端等式法：与终端等式法一样，在预测时域的终端加一个输出的不等式约束，把系统在预测时域的终端约束在稳定点领域内

2.1 不等式约束

优化问题可行解：
- 满足约束条件
- 目标函数的值有界
稳定性分析：由于稳定性分析是建立在无限时域上的，因此可以在预测终端增加一个终端等式约束（稳定状态），那么预测时域之外的控制就可以全部取0，这样优化问题就可以从有限时域到无限时域。

$\text{优化问题：}V_k=\sum_{j=0}^{p-1}{\left( \left\| Cx_{k+j|k}-\,\,y_{k+j}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k+j|k} \right\| _{\varepsilon _1}^{2} \right)} \\ u_{k}^{*}=\underset{u_k}{arg\,\,\min}V_k \\ s.t.\begin{cases} \left( i \right) u_k\epsilon \left[ u,\bar{u} \right]\\ \left( ii \right) x_{k|k}=x_k\\ \left( iii \right) y_{k+p}=Cx_{k+p}=y_{k+p}^{r}\,\,\text{终端等式约束}\\ \left( iv \right) x_{k+j|k}=Ax_{k+j-1|k}+Bu_{k+j-1}\\ \end{cases} \\ \text{假设}K\text{时刻有最优解：}u_{k}^{*}=\left\{ u_{k|k}^{*}\,\,u_{k+1|k}^{*}\,\,\cdots \,\,u_{k+p-1|k}^{*} \right\} , y_{k}^{*}=\left\{ y_{k|k}^{*}\,\,y_{k+1|k}^{*}\,\,\cdots y_{k+p-1|k}^{*}\,\,y_{k+p}^{r} \right\} \\ \text{此时优化问题的值为：}V_{k}^{*} \\ \\ k+1\text{时刻，}y_{k+p+1|k}^{*}=y_{k+p+1}^{r},u_{k+p|k+1}=u_{k+p|k}^{*}0 \\ \text{则}k+1\text{时刻可以选择如下控制输入：}u_{k+1}=\left\{ u_{k+1|k}^{*}\,\,u_{k+2|k}^{*}\cdots \,\,u_{k+p-1|k}^{*}\,\,0 \right\} ,y_{k+1}=\left\{ y_{k+1|k}^{*}\,\,y_{k+2|k}^{*}\cdots y_{k+p-1|k}^{*}\,\,y_{k+p}^{r}\,\,y_{k+p+1}^{r} \right\} \\ \\ \text{优化问题的值：}V_{k+1}=\sum_{j=0}^{p-1}{\left( \left\| Cx_{k+1+j|k+1}-\,\,y_{k+j+1}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k+j+1|k+1} \right\| _{\varepsilon _1}^{2} \right)} \\ \\ =\sum_{j=1}^p{\left( \left\| Cx_{k+j|k}-\,\,y_{k+j}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k+j|k} \right\| _{\varepsilon _1}^{2} \right)}=V_{k}^{*}-\left( \left\| Cx_{k|k}-\,\,y_{k}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k|k} \right\| _{\varepsilon _1}^{2} \right) \leqslant V_{k}^{*} \\ \text{故}u_{k+1}\text{是可行解，优化解的值好于可行解的值} \\ \text{因此}V_{k+1}^{*}\leqslant V_{k+1}\leqslant V_{k}^{*}\text{，所以系统是渐进稳定的} \\ \\$

2.2 不等式约束

等式约束是在约束优化问题中加入终端等式约束，使得预测控制闭环系统内部稳定。然而加入终端等式约束会带来如下问题：
- 易引起优化问题的不可行
- 导致较小的稳定域
- 在数值计算不易实现
因此，在约束优化问题中引入较宽松的不等式约束 $x\left( k+m \right) \,\,\varepsilon \,\,\varOmega$ ，其中 $\varOmega$ 是平衡点的一个邻域。这种方法的基本出发点是在平衡点的邻域内可以用无约束线性反馈来控制系统。对于一个线性系统而言，如果（A，B）是可稳的，则必存在一个状态反馈u=Kx 使得（A+Bk）是渐进稳定的。而且，由函数的连续性可知必存在一个平衡点的邻域 $\varOmega$ ，使得系统满足控制约束和输出约束，即
$u_{\min}\leqslant Kx\,\,\leqslant \,\,u_{\max} \\ y_{\min}\leqslant Cx\,\,\leqslant \,\,y_{\max}$
并且还需要满足 $\left( A+BK \right) x\,\,\varepsilon \,\,\varOmega$
稳定性分析
$\text{优化问题：}V_k=\sum_{j=0}^{p-1}{\left( \left\| Cx_{k+j|k}-\,\,y_{k+j}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k+j|k} \right\| _{\varepsilon _1}^{2} \right)}+\left\| x\left( k+p|k \right) \right\| _{m}^{2} \\ u_{k}^{*}=\underset{u_k}{arg\,\,\min}V_k \\ s.t.\begin{cases} \left( i \right) u_k\epsilon \left[ u,\bar{u} \right]\\ \left( ii \right) x_{k|k}=x_k\\ \left( iii \right) y_{k+p}\,\,\varepsilon \,\,\varOmega \,\,\text{终端不等式约束}\\ \left( iv \right) x_{k+j|k}=Ax_{k+j-1|k}+Bu_{k+j-1}\\ \end{cases} \\ \text{假设}K\text{时刻有最优解：}u_{k}^{*}=\left\{ u_{k|k}^{*}\,\,u_{k+1|k}^{*}\,\,\cdots \,\,u_{k+p-1|k}^{*} \right\} , y_{k}^{*}=\left\{ y_{k|k}^{*}\,\,y_{k+1|k}^{*}\,\,\cdots y_{k+p-1|k}^{*}\,\,\varOmega \right\} \\ \text{此时优化问题的值为：}V_{k}^{*} \\ \\ \\ \text{则}k+1\text{时刻可以选择如下控制输入：}u_{k+1}=\left\{ u_{k+1|k}^{*}\,\,u_{k+2|k}^{*}\cdots \,\,u_{k+p-1|k}^{*}\,\,Kx^*\left( k+p|k \right) \right\} \\ \text{因为}x^*\left( k+p|k \right) \,\,\varepsilon \,\,\varOmega \text{，所以有}Kx^*\left( k+p|k \right) \epsilon \left[ u,\bar{u} \right] ,\text{输入满足约束} \\ \text{因为：}x\left( k+p+1|k+1 \right) =\left( A+BK \right) x^*\left( k+p|k \right) \varepsilon \,\,\varOmega \text{，输出满足约束} \\ \text{优化问题的值：}V_{k+1}=\sum_{j=0}^{p-1}{\left( \left\| Cx_{k+1+j|k+1}-\,\,y_{k+j+1}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k+j+1|k+1} \right\| _{\varepsilon _1}^{2} \right)}+\left\| x\left( k+1+p|k+1 \right) \right\| _{m}^{2} \\ =\sum_{j=1}^p{\left( \left\| Cx_{k+j|k}-\,\,y_{k+j}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k+j|k} \right\| _{\varepsilon _1}^{2} \right)}=V_{k}^{*}-\left( \left\| Cx_{k|k}-\,\,y_{k}^{r} \right\| _{\varepsilon _1}^{2}+\left\| u_{k|k} \right\| _{\varepsilon _1}^{2} \right) \leqslant V_{k}^{*} \\ \text{故}u_{k+1}\text{是可行解，优化解的值不会差于可行解的值} \\ \text{因此}V_{k+1}^{*}\leqslant V_{k+1}\leqslant V_{k}^{*}\text{，所以系统是渐进稳定的} \\ \\ \\$