Robust MPC 2 （反馈与开环控制）

最新推荐文章于 2024-07-25 13:54:27 发布

effer_ujs

最新推荐文章于 2024-07-25 13:54:27 发布

阅读量437

点赞数 11

文章标签：算法

本文链接：https://blog.csdn.net/weixin_44299806/article/details/134891223

版权

Robust and Stochastic Model Predictive Control

反馈与开环控制

众所周知，当存在不确定性时，反馈控制是一种十分必要的解决方案；当不存在不确定性时，反馈与开环控制可视为等价的。事实上，当不存在不确定性时，可以使用提供最优控制策略或反馈控制律序列的动态规划 (DP) 来计算给定初始状态的最优控制，或者使用仅提供一系列控制动作的开环最优控制。下面举例说明，考虑确定性线性动态系统为：

$x^+=x+u$

滚动区间为3的最优控制问题可描述为：

${P_3}(x):V_3^0(x) = \mathop {\min }\limits_{{{\bf{u}}_{\bf{3}}}} {V_3}(x,{\bf{u}})$

其中， ${\bf{u}} = (u(0),u(1),u(2))$

${V_3}(x,{\bf{u}}): = (1/2)\sum\limits_{i = 0}^2 {[(x{{(i)}^2} + u{{(i)}^2})]} + (1/2)x{(3)^2}$

其中，对每个 $i$ , $\phi (i;x,{\bf{u}}) = x + u(0) + u(1) + ... + u(i - 1)$ 差分方程 $x^+=x+u$ 在时间 $i$ 的解为 ${\bf{u}} = (u(0),u(1),u(2))$ ，如果初始状态 $x (0) = x$ ; $\bf{u}$ 为列向量。因此

${V_3}(x,{\bf{u}}) = (3/2){x^2} + x\begin{bmatrix} 3&2&1 \end{bmatrix}{\bf{u}} + (1/2){{\bf{u}}^T}{P_3}{\bf{u}}$

其中
$\begin{bmatrix} 4 & 2 &1 \\ 2 & 3 &1 \\ 1 & 1 &2 \end{bmatrix}$

因此，对于 $x$ 的初始状态，最优开环控制序列的向量形式为:
${{\bf{u}}^0}(x) = - {P_3}^{ - 1}\begin{bmatrix} 3&2&1 \end{bmatrix}x = - \begin{bmatrix} 0.615&0.231&0.077 \end{bmatrix}^Tx$
最优控制序列和状态序列为：
${{\bf{u}}^0}(x) = -\begin{bmatrix} 0.615x&0.231x&0.077x \end{bmatrix}^T$
${{\bf{x}}^0}(x) = \begin{bmatrix} {x{\rm{ }}}&{{\rm{0}}{\rm{.385}}x}&{{\rm{0}}{\rm{.154}}x}&{0.077x} \end{bmatrix}$

下面我们计算最优反馈控制，然后对比上述的开环最优控制，我们使用2DP递归方法：
$V_i^0 = \mathop {\min }\limits_{u \in {\mathbb R}} \{ {x^2}/2 + {u^2}/2 + V_{i - 1}^0(x + u)\}$
$\kappa _i^0 = \mathop {\arg \min }\limits_{u \in {\mathbb R}} \{ {x^2}/2 + {u^2}/2 + V_{i - 1}^0(x + u)\}$
边界条件：
$V_0^0(x) = (1/2){x^2}$

求解递归问题，对于 $\in {\mathbb R},i \in \{ 1,2,3\}$ 得到：
$\begin{array}{l} V_1^0(x) = (3/4){x^2},\kappa _1^0(x) = - (1/2)x\\ V_2^0(x) = (4/5){x^2},\kappa _2^0(x) = - (3/5)x\\ V_3^0(x) = (21/26){x^2},\kappa _3^0(x) = - (8/13)x \end{array}$
从初始时刻开始，并将最优控制律迭代地应用于确定性系统 $x^+=x+u$ (在时间 $i$ 时的最优控制律为 $\kappa _{3 - i}^0( \cdot )$ ) 得到：
$\begin{array}{l} {x^0}(0) = x,{u^0}(0) = - (8/13)x\\ {x^0}(1) = (5/13)x,{u^0}(1) = - (3/13)x\\ {x^0}(2) = (2/13)x,{u^0}(2) = - (1/13)x\\ {x^0}(3,x) = (1/13)x \end{array}$
使得最优控制序列和状态序列分别为:

${{\bf{u}}^0}(x) = -\begin{bmatrix} 0.615x&0.231x&0.077x \end{bmatrix}^T$
${{\bf{x}}^0}(x) = \begin{bmatrix} {x{\rm{ }}}&{{\rm{0}}{\rm{.385}}x}&{{\rm{0}}{\rm{.154}}x}&{0.077x} \end{bmatrix}$
这与上面计算的最佳开环控制序列相同。