最优控制（一）——最优控制问题概述和静态最优问题的解

于灯火阑珊处

已于 2023-12-10 18:11:09 修改

阅读量386

点赞数 4

分类专栏：控制理论文章标签：算法笔记

于 2023-12-10 18:01:40 首次发布

本文链接：https://blog.csdn.net/m0_51323388/article/details/134911854

版权

控制理论专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最优控制（一）——最优控制问题概述和静态最优问题的解

最优控制问题，其实就是一类最优化问题，如果优化过程中 $\boldsymbol{x}$ 与时间无关，或在所讨论的时间范围内为常量，就将该最优化问题称为静态最优化问题，反之就称为动态最优化问题。显然，在最优控制领域中，被控对象的状态会随着时间而变化，因此属于动态最优化问题。在动态最优化问题中，目标函数不再是普通函数，而是时间函数的函数，称为泛函数，简称泛函。

1. 研究最优控制的前提条件

给出受控系统的动态描述，即状态空间表达式。
明确控制作用域：
- 控制矢量 $\boldsymbol{u}(t)$ 的可取范围组成的集合：
  $U=\{\boldsymbol{u}(t)|\varphi_j(\boldsymbol{x},\boldsymbol{u})\leqslant0,j=1,2,\dots m,(m\leqslant r)\}$
  
  称为控制集，把控制集中的元素称为容许控制。
明确初始条件：
- 如果初始条件 $\boldsymbol{x}(t_0)$ 是给定的，就将该最优控制问题称为固定始端，否则称为自由始端。
- 如果自由始端问题的 $\boldsymbol{x}(t_0)$ 满足某些约束条件，那么就将满足约束的初始条件组成的集合称为始端集：
  $\Omega_0=\{\boldsymbol{x}(t_0)|\rho_j[\boldsymbol{x}(t_0)]=0,j=1,2,\dots m,(m\leqslant r)\}$
  
  此时就将始端集中的元素称为可变始端。
明确终端条件：
- 固定终端是指终端时刻 $t_f$ 和终端状态 $\boldsymbol{x}(t_f)$ 都是给定的。
- 可变终端是指终端状态 $\boldsymbol{x}(t_f)\in\Omega_f$ 的情况，其中
  $\Omega_f=\{\boldsymbol{x}(t_f)|\varphi_j[\boldsymbol{x}(t_f)]=0,j=1,2,\dots m,(m\leqslant r)\}$
  
  是由约束条件所形成的目标集。
给出目标泛函或者说性能指标：

对于连续时间系统一般表述为：

$J=\varPhi[\boldsymbol{x}(t_f)]+\int_{t_0}^{t_f}L[\boldsymbol{x}(t),\boldsymbol{u}(t)]\textrm{d}t$

对于离散时间系统一般表述为：

$J=\varPhi[\boldsymbol{x}(N)]+\sum_{k=k_0}^{N-1}L[\boldsymbol{x}(k),\boldsymbol{u}(k),k]$

上述的形式称为综合型或者鲍尔扎型。它主要由描述对终端性能的要求的终端指标函数和描述对动态品质及能量或者燃料消耗的要求的动态指标函数。
- 如果不考虑终端指标函数项，那么就有 $\varPhi=0$ ，则有：
  $J=\int_{t_0}^{t_f}L[\boldsymbol{x}(t),\boldsymbol{u}(t)]\textrm{d}t\\ J=\sum_{k=k_0}^{N-1}L[\boldsymbol{x}(k),\boldsymbol{u}(k),k]$
  这种形式的性能指标称为积分型或者拉格朗日型。
- 如果不考虑动态指标函数项， $L = 0$ ，那么就有：
  $J=\varPhi[\boldsymbol{x}(t_f)]\\ J=\varPhi[\boldsymbol{x}(N)]$
  称为终端型或者梅耶型。

最优控制问题主要就是从容许控制集 $U$ 中，寻求一个控制矢量 $\boldsymbol{u}(t)$ ，使受控系统在时间域 $t_0,t_f]$ 内，从初态 $\boldsymbol{x}(t_0)$ 转移到终态 $\boldsymbol{x}(t_f)$ 或者目标集 $\boldsymbol{x}(t_f)\in\Omega_f$ 时性能指标 $J$ 取得最大值或者最小值。满足上述条件的控制 $\boldsymbol{u}(t)$ 称为最优控制 $\boldsymbol{u}^*(t)$ 。在 $\boldsymbol{u}^*(t)$ 作用下状态空间方程的解称为最佳轨线 $\boldsymbol{x}^*(t)$ 。沿最佳轨线 $\boldsymbol{x}^*(t)$ 使性能指标 $J$ 所达到的最优值称为最优指标 $\boldsymbol{J^*}$ 。

为了工程上实现的便利，一般会按照二次型性能指标设计系统，线性二次型性能指标的一般形式为：
$J=\frac{1}{2}\boldsymbol{x}^T(t_f)\boldsymbol{Q}_0\boldsymbol{x}(t_f)+\frac{1}{2}\int_{t_0}^{t_f}\left[\boldsymbol{x}^T(t)\boldsymbol{Q}_1\boldsymbol{x}(t)+\boldsymbol{u}^T(t)\boldsymbol{Q}_2\boldsymbol{u}(t)\right]\textrm{d}t\\ J=\frac{1}{2}\boldsymbol{x}^T(N)\boldsymbol{Q}_0(N)\boldsymbol{x}(N)+\frac{1}{2}\sum_{k=k_0}^{N-1}\left[\boldsymbol{x}^T(k)\boldsymbol{Q}_1(k)\boldsymbol{x}(k)+\boldsymbol{u}^T(k)\boldsymbol{Q}_2(k)\boldsymbol{u}(k)\right]$

式中的 $\boldsymbol{Q}_0,\boldsymbol{Q}_1,\boldsymbol{Q}_2$ 和 $\boldsymbol{Q}_0(N),\boldsymbol{Q}_1(k),\boldsymbol{Q}_2(k)$ 都称为加权矩阵。

2. 静态最优化问题的解

静态最优化问题的目标使一个多元普通函数，因此可以直接使用多元微分学来解决。

2.1 一元函数的极值

如果一个一元实函数 $J = f (u)$ 在闭区间 $[a, b]$ 上连续可微，那么该函数在该区间内存在非端点的极值点 $u^*$ 的条件是:
$f'(u)\bigg|_{u=u^*}=0$
$u^*$ 是极小值点的充要条件是:
$f'(u^*)=0,f''(u^*)>0$
$u^*$ 是极大值点的充要条件是:
$f'(u^*)=0,f''(u^*)<0$
通过上述方法计算出来的极值点一般称为驻点，具有局部最值性质，如果将区间内所有极值进行比较就可以得到最小的极值也就是最值，它具有全局最值性：
$J^*=f(u^*)=\min_{u\in U}f(u)$

2.2 多元函数的极值

设 n 元函数 $f(\boldsymbol{u})$ ，这里 $\boldsymbol{u}=\begin{pmatrix} u_1,&u_2,&\cdots,&u_n \end{pmatrix}^T$ 是一个 n 维列向量。那么该函数取到极值的必要条件是：
$\frac{\partial f}{\partial \boldsymbol{u}}=\boldsymbol{0}\textrm{ Or }\nabla f_u=\boldsymbol{0}$

如果需要取到极小值，那么还需要 Hessian 矩阵正定：
$\frac{\partial^2f}{\partial \boldsymbol{u}^2}=\begin{pmatrix} \displaystyle\frac{\partial^2f}{\partial u_1^2} & \displaystyle\frac{\partial^2f}{\partial u_1\partial u_2} & \cdots & \displaystyle\frac{\partial^2f}{\partial u_1\partial u_n}\\ \displaystyle\frac{\partial^2f}{\partial u_2\partial u_1} & \displaystyle\frac{\partial^2f}{\partial u_2^2} & \cdots & \displaystyle\frac{\partial^2f}{\partial u_2\partial u_n}\\ \vdots & \vdots & & \vdots\\ \displaystyle\frac{\partial^2f}{\partial u_n\partial u_1} & \displaystyle\frac{\partial^2f}{\partial u_n\partial u_2} & \cdots & \displaystyle\frac{\partial^2f}{\partial u_n^2} \end{pmatrix}>0$

2.3 具有等式约束的条件极值

主要考虑消元法或者拉格朗日乘数法，后者具有普遍意义。设连续可微函数
$J=f(\boldsymbol{x},\boldsymbol{u})$

和等式约束
$\boldsymbol{g}(\boldsymbol{x},\boldsymbol{u})=\boldsymbol{0}$

其中， $\boldsymbol{x}$ 为 n 维列向量， $\boldsymbol{u}$ 为 r 维列向量， $\boldsymbol{g}$ 为 n 维矢量函数。

接下来，使用与 $\boldsymbol{g}$ 同维的乘子矢量 $\boldsymbol{\lambda}$ 与约束条件相乘并与目标函数相加得到拉格朗日函数：
$H=J+\boldsymbol{\lambda}^T\boldsymbol{g}=f(\boldsymbol{x},\boldsymbol{u})+\boldsymbol{\lambda}^T\boldsymbol{g}(\boldsymbol{x},\boldsymbol{u})$

就可以按照无约束的方法进行求解，目标函数存在极值的必要条件是：
$\begin{cases} \displaystyle\frac{\partial H}{\partial\boldsymbol{x}}=\boldsymbol{0}\\ \displaystyle\frac{\partial H}{\partial\boldsymbol{u}}=\boldsymbol{0}\\ \displaystyle\frac{\partial H}{\partial\boldsymbol{\lambda}}=\boldsymbol{0} \end{cases}\\ \Rightarrow\begin{cases} \displaystyle\frac{\partial f}{\partial\boldsymbol{x}}+\left(\displaystyle\frac{\partial\boldsymbol{g}}{\partial\boldsymbol{x}}\right)^T\boldsymbol{\lambda}=0\\ \displaystyle\frac{\partial f}{\partial\boldsymbol{u}}+\left(\displaystyle\frac{\partial\boldsymbol{g}}{\partial\boldsymbol{u}}\right)^T\boldsymbol{\lambda}=0\\ \boldsymbol{g}(\boldsymbol{x},\boldsymbol{u})=\boldsymbol{0} \end{cases}$

其中：
$\frac{\partial\boldsymbol{g}}{\partial\boldsymbol{x}}=\begin{pmatrix} \displaystyle\frac{\partial g_1}{\partial x_1} & \displaystyle\frac{\partial g_1}{\partial x_2} & \cdots & \displaystyle\frac{\partial g_1}{\partial x_n}\\ \displaystyle\frac{\partial g_2}{\partial x_1} & \displaystyle\frac{\partial g_2}{\partial x_2} & \cdots & \displaystyle\frac{\partial g_2}{\partial x_n}\\ \vdots & \vdots & & \vdots\\ \displaystyle\frac{\partial g_n}{\partial x_1} & \displaystyle\frac{\partial g_n}{\partial x_2} & \cdots & \displaystyle\frac{\partial g_n}{\partial x_n} \end{pmatrix}\\\textrm{ }\\ \frac{\partial\boldsymbol{g}}{\partial\boldsymbol{u}}=\begin{pmatrix} \displaystyle\frac{\partial g_1}{\partial u_1} & \displaystyle\frac{\partial g_1}{\partial u_2} & \cdots & \displaystyle\frac{\partial g_1}{\partial u_n}\\ \displaystyle\frac{\partial g_2}{\partial u_1} & \displaystyle\frac{\partial g_2}{\partial u_2} & \cdots & \displaystyle\frac{\partial g_2}{\partial u_n}\\ \vdots & \vdots & & \vdots\\ \displaystyle\frac{\partial g_n}{\partial u_1} & \displaystyle\frac{\partial g_n}{\partial u_2} & \cdots & \displaystyle\frac{\partial g_n}{\partial u_n} \end{pmatrix}$

【例】求使 $J=f(\boldsymbol{x},\boldsymbol{u})=\displaystyle\frac{1}{2}\boldsymbol{x}^T\boldsymbol{Q}_1\boldsymbol{x}+\displaystyle\frac{1}{2}\boldsymbol{u}^T\boldsymbol{Q}_2\boldsymbol{u}$ 取极值的 $\boldsymbol{x}^*$ 和 $\boldsymbol{u}^*$ 。它们满足约束条件 $\boldsymbol{g}(\boldsymbol{x},\boldsymbol{u})=\boldsymbol{x}+\boldsymbol{F}\boldsymbol{u}+\boldsymbol{d}=\boldsymbol{0}$ ，其中 $\boldsymbol{Q}_1, \boldsymbol{Q}_2$ 均为正定矩阵， $\boldsymbol{F}$ 维任意矩阵。
【解】构造拉格朗日函数：
$H=J+\boldsymbol{\lambda}^T\boldsymbol{g}=\displaystyle\frac{1}{2}\boldsymbol{x}^T\boldsymbol{Q}_1\boldsymbol{x}+\displaystyle\frac{1}{2}\boldsymbol{u}^T\boldsymbol{Q}_2\boldsymbol{u}+\boldsymbol{\lambda}^T(\boldsymbol{x}+\boldsymbol{F}\boldsymbol{u}+\boldsymbol{d})$
由极值存在的必要条件可知：
$\begin{cases} \displaystyle\frac{\partial H}{\partial\boldsymbol{x}}=\boldsymbol{Q}_1\boldsymbol{x}+\boldsymbol{\lambda}=\boldsymbol{0}\\ \displaystyle\frac{\partial H}{\partial\boldsymbol{u}}=\boldsymbol{Q}_2\boldsymbol{u}+\boldsymbol{F}^T\boldsymbol{\lambda}=\boldsymbol{0}\\ \displaystyle\frac{\partial H}{\partial\boldsymbol{\lambda}}=\boldsymbol{x}+\boldsymbol{F}\boldsymbol{u}+\boldsymbol{d}=\boldsymbol{0} \end{cases}$

由于 $\boldsymbol{Q}_1,\boldsymbol{Q}_2$ 正定所以极值存在，讲上述方程联立可以求得极值为：
$\begin{cases} \boldsymbol{x}^*=-[\boldsymbol{I}-\boldsymbol{F}(\boldsymbol{Q}_2+\boldsymbol{F}^T\boldsymbol{Q_1}\boldsymbol{F})^{-1}\boldsymbol{F}^T\boldsymbol{Q}_1]\boldsymbol{d}\\ \boldsymbol{u}^*=-(\boldsymbol{Q}_2+\boldsymbol{F}^T\boldsymbol{Q}_1\boldsymbol{F})^{-1}\boldsymbol{F}^T\boldsymbol{Q}_1\boldsymbol{d}\\ \boldsymbol{\lambda}^*=\boldsymbol{Q}_1[\boldsymbol{I}-\boldsymbol{F}(\boldsymbol{Q}_2+\boldsymbol{F}^T\boldsymbol{Q_1}\boldsymbol{F})^{-1}\boldsymbol{F}^T\boldsymbol{Q}_1]\boldsymbol{d} \end{cases}$

3. 离散时间系统的最优控制

3.1 基本形式

考虑如下离散时间系统：
$\begin{cases} \boldsymbol{x}(k+1)=\boldsymbol{f}[\boldsymbol{x}(k),\boldsymbol{u}(k),k],(k=0,1,\cdots,N-1)\\ \boldsymbol{x}(0)=\boldsymbol{x}_0 \end{cases}$

最优控制的问题就是确定矢量序列 $\{\boldsymbol{u}(1),\boldsymbol{u}(2),\cdots,\boldsymbol{u}(N-1)\}$ 使得下列函数取得最小值：
$J=\varPhi[\boldsymbol{x}(N)]+\sum_{k=0}^{N-1}L[\boldsymbol{x}(k),\boldsymbol{u}(k),k]$

这里暂且假定 $\boldsymbol{x}(N)$ 为自由终端，这样的问题和前一个小节中的无约束问题实际上并没有区别，于是可以构建约束方程为：
$\boldsymbol{f}[\boldsymbol{x}(k),\boldsymbol{u}(k),k]-\boldsymbol{x}(k+1)=\boldsymbol{0},(k=0,1,\cdots,N-1)$

在这个优化问题中，待优化变量总共有这样的 $N (n + r)$ 个：
$\{x_1(k),x_2(k),\cdots,x_n(k)\},(k=1,2,\cdots,N)\\ \{u_1(k),u_2(k),\cdots,u_r(k)\},(k=0,1,\cdots,N-1)$

因此需要的拉格朗日乘数的数量也需要对应的进行扩大，这里定义 $N n$ 个变量：
$\{\lambda_1(k),\lambda_2(k),\cdots,\lambda_n(k)\},(k=1,2,\cdots,N)$

于是构造一个新的拉格朗日函数为：
$\begin{aligned} V&=\varPhi[\boldsymbol{x}(N)]+\sum_{k=0}^{N-1}\left\{L[\boldsymbol{x}(k),\boldsymbol{u}(k),k]+\boldsymbol{\lambda}^T(k+1)[\boldsymbol{f}[\boldsymbol{x}(k),\boldsymbol{u}(k),k]-\boldsymbol{x}(k+1)]\right\}\\ &\equiv\varPhi[\boldsymbol{x}(N)]+\sum_{k=0}^{N-1}\left[L_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]+\boldsymbol{\lambda}^T(k+1)\boldsymbol{f}_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]-\boldsymbol{\lambda}^T(k+1)\boldsymbol{x}(k+1)\right]\\ &\equiv\varPhi[\boldsymbol{x}(N)]+\sum_{k=0}^{N-1}\left[H_k-\boldsymbol{\lambda}^T(k+1)\boldsymbol{x}(k+1)\right]\\ &=\varPhi[\boldsymbol{x}(N)]+H_0-\boldsymbol{\lambda}^T(N)\boldsymbol{x}(N)+\sum_{k=1}^{N-1}\left[H_k-\boldsymbol{\lambda}^T(k)\boldsymbol{x}(k)\right] \end{aligned}$

对该问题求最优可以得到极值条件：
$\begin{cases} \displaystyle\frac{\partial V}{\partial\boldsymbol{x}(k)}=\frac{\partial H_k}{\partial\boldsymbol{x}(k)}-\boldsymbol{\lambda}(k)=\boldsymbol{0},(k=1,2,\cdots,N-1)\\ \displaystyle\frac{\partial V}{\partial\boldsymbol{x}(N)}=\frac{\partial\varPhi[\boldsymbol{x}(N)]}{\partial\boldsymbol{x}(N)}-\boldsymbol{\lambda}(N)=\boldsymbol{0}\\ \displaystyle\frac{\partial V}{\partial\boldsymbol{u}(k)}=\frac{\partial H_k}{\partial\boldsymbol{u}(k)}=\boldsymbol{0},(k=0,1,\cdots,N-1)\\ \displaystyle\frac{\partial V}{\partial\boldsymbol{\lambda}(k)}=\boldsymbol{f}_{k-1}[\boldsymbol{x}(k-1),\boldsymbol{u}(k-1)]-\boldsymbol{x}(k)=\boldsymbol{0},(k=1,2,\cdots,N) \end{cases}\\ \Rightarrow\begin{cases} \boldsymbol{x}(0)=\boldsymbol{x}_0\\ \displaystyle\frac{\partial H_k}{\partial\boldsymbol{x}(k)}=\frac{\partial L_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]}{\partial\boldsymbol{x}(k)}+\left[\frac{\partial\boldsymbol{f}_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]}{\partial\boldsymbol{x}(k)}\right]^T\boldsymbol{\lambda}(k+1)=\boldsymbol{\lambda}(k)\\ \displaystyle\frac{\partial H_k}{\partial\boldsymbol{u}(k)}=\frac{\partial L_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]}{\partial\boldsymbol{u}(k)}+\left[\frac{\partial\boldsymbol{f}_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]}{\partial\boldsymbol{u}(k)}\right]^T\boldsymbol{\lambda}(k+1)=\boldsymbol{0}\\ \displaystyle\frac{\partial H_k}{\partial\boldsymbol{\lambda}(k+1)}=\boldsymbol{f}_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]-\boldsymbol{x}(k+1)=\boldsymbol{0}\\ \displaystyle\frac{\partial\varPhi[\boldsymbol{x}(N)]}{\boldsymbol{x}(N)}=\boldsymbol{\lambda}(N) \end{cases}\\ (k=0,1,\cdots,N-1)$

上述方程组中各个方程具有的方程个数分别为 $n, (N - 1) n, N r, N n, n$ ，总计 $(2 n + r) N + n$ 。而现在拥有的待优化变量数为:
$N\textrm{rank}(\boldsymbol{x})+N\textrm{rank}(\boldsymbol{\lambda})+N\textrm{rank}(\boldsymbol{u})=(2n+r)N$

如果在上述问题中，给定终端时刻 N 上的 $\boldsymbol{\lambda}(N)$ 和初始时刻的 $\boldsymbol{x}(0)$ ，求解这种给定两点边界的问题称为两点边值问题。

3.2 具有二次型性能指标的线性时不变系统

设离散时间线性定常系统：
$\begin{cases} \boldsymbol{x}(k+1)=\boldsymbol{G}\boldsymbol{x}(k)+\boldsymbol{H}\boldsymbol{u}(k),(k=0,1,\cdots,N-1)\\ \boldsymbol{x}(0)=\boldsymbol{x}_0 \end{cases}$

要求的性能指标为：
$J=\sum_{k=1}^{N-1}\frac{1}{2}\left[\boldsymbol{x}^T(k)\boldsymbol{Q}_1(k)\boldsymbol{x}(k)+\boldsymbol{u}^T(k)\boldsymbol{Q}_2(k)\boldsymbol{u}(k)\right]+\frac{1}{2}\boldsymbol{x}^T(N)\boldsymbol{Q}_0(N)\boldsymbol{x}(N)$

其中 $\boldsymbol{Q}_0(N),\boldsymbol{Q}_1(k),\boldsymbol{Q}_2(k)$ 都是正定矩阵，且系统的状态转移矩阵 $\boldsymbol{G}$ 可逆。

那么按照前一节的推到可以写出
$H_k=\frac{1}{2}[\boldsymbol{x}^T(k)\boldsymbol{Q}_1(k)\boldsymbol{x}(k)+\boldsymbol{u}^T(k)\boldsymbol{Q}_2(k)\boldsymbol{u}(k)]+\boldsymbol{\lambda}^T(k+1)[\boldsymbol{Gx}(k)+\boldsymbol{Hu}(k)]\\ \varPhi[\boldsymbol{x}(N)]=\frac{1}{2}\boldsymbol{x}^T(N)\boldsymbol{Q}_1(N)\boldsymbol{x}(N)$

那么就可以根据前面的方程得到受约束的极值条件：
$\begin{cases} \boldsymbol{x}(0)=\boldsymbol{x}_0\\ \boldsymbol{Q}_1(k)\boldsymbol{x}(k)+\boldsymbol{G}^T\boldsymbol{\lambda}(k+1)=\boldsymbol{\lambda}(k)\\ \boldsymbol{Q}_2(k)\boldsymbol{u}(k)+\boldsymbol{H}^T\boldsymbol{\lambda}(k+1)=\boldsymbol{0}\\ \boldsymbol{Gx}(k)+\boldsymbol{Hu}(k)-\boldsymbol{x}(k+1)=\boldsymbol{0}\\ \boldsymbol{Q}_0(N)\boldsymbol{x}(N)=\boldsymbol{\lambda}(N) \end{cases}\\ k=0,1,\cdots,N-1$

根据第三个方程组可以得到：
$\boldsymbol{u}(k)=-\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{\lambda}(k+1)$

带入第四个方程组：
$\boldsymbol{x}(k+1)=\boldsymbol{G}\boldsymbol{x}(k)-\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{\lambda}(k+1)$

由最后一个方程可知，存在矩阵 $\boldsymbol{P}(N)=\boldsymbol{Q}_0(N)$ 使得 $\boldsymbol{\lambda}(N)=\boldsymbol{P}(N)\boldsymbol{x}(N)$ 成立。

假设当 $k = n + 1$ 时存在矩阵 $\boldsymbol{P}(n+1)$ 使得 $\boldsymbol{\lambda}(n+1)=\boldsymbol{P}(n+1)\boldsymbol{x}(n+1)$ 成立，接下来证明当 $k = n$ 时该结论仍然成立：
$\begin{aligned} \boldsymbol{x}(n+1)&=\boldsymbol{G}\boldsymbol{x}(n)-\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{\lambda}(n+1)\\ &=\boldsymbol{G}\boldsymbol{x}(n)-\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{P}(n+1)\boldsymbol{x}(n+1) \end{aligned}\\ \Rightarrow\boldsymbol{x}(n+1)=\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{P}(n+1)\right]^{-1}\boldsymbol{G}\boldsymbol{x}(n)\\ \Rightarrow\boldsymbol{\lambda}(n+1)=\boldsymbol{P}(n+1)\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{P}(n+1)\right]^{-1}\boldsymbol{G}\boldsymbol{x}(n)$

带入上面的第二个方程组可以得到：
$\boldsymbol{Q}_1(n)\boldsymbol{x}(n)+\boldsymbol{G}^T\boldsymbol{P}(n+1)\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{P}(n+1)\right]^{-1}\boldsymbol{G}\boldsymbol{x}(n)=\boldsymbol{\lambda}(n)\\ \Rightarrow\boldsymbol{\lambda}(n)=\left\{\boldsymbol{Q}_1(n)+\boldsymbol{G}^T\boldsymbol{P}(n+1)\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{P}(n+1)\right]^{-1}\boldsymbol{G}\right\}\boldsymbol{x}(n)$

即存在 $\boldsymbol{P}(n)=\boldsymbol{Q}_1(n)+\boldsymbol{G}^T\boldsymbol{P}(n+1)\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(n)\boldsymbol{H}^T\boldsymbol{P}(n+1)\right]^{-1}\boldsymbol{G}$ 使得表达式 $\boldsymbol{\lambda}(k)=\boldsymbol{P}(k)\boldsymbol{x}(k)$ 对 $k = n$ 成立。

所以由数学归纳法可以知道，对于任意的 $k=0,1,\cdots,N-1$ 都有 $\boldsymbol{\lambda}(k)=\boldsymbol{P}(k)\boldsymbol{x}(k)$ 。而且可以根据上述递推公式从 $\boldsymbol{Q}_0(N)$ 开始依次向前迭代得到 $\boldsymbol{P}(N-1),\boldsymbol{P}(N-2),\cdots,\boldsymbol{P}(1)$ 。

最后，根据上述结论结合前面的方程组可以得到最优控制率为：
$\boldsymbol{Q}_2(k)\boldsymbol{u}(k)=-\boldsymbol{H}^T\boldsymbol{\lambda}(k+1)=-\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{x}(k+1)\\ \Rightarrow\boldsymbol{u}(k)=-\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{x}(k+1)\\ \Rightarrow\boldsymbol{Gx}(k)-\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{x}(k+1)-\boldsymbol{x}(k+1)=\boldsymbol{0}\\ \Rightarrow\boldsymbol{x}(k+1)=\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]^{-1}\boldsymbol{Gx}(k)\\ \Rightarrow\boldsymbol{u}(k)=-\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]^{-1}\boldsymbol{Gx}(k)$

然后整理一下就可以得到常用的最优控制率形式：
$\begin{aligned} \boldsymbol{u}(k)&=-\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]^{-1}\boldsymbol{Gx}(k)\\ &=-\left[\boldsymbol{Q}_2(k)+\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{H}\right]^{-1}\left[\boldsymbol{Q}_2(k)+\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{H}\right]\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\cdot\\ &\qquad\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]^{-1}\boldsymbol{Gx}(k)\\ &=-\left[\boldsymbol{Q}_2(k)+\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{H}\right]^{-1}\left[\boldsymbol{H}^T\boldsymbol{P}(k+1)+\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{H}\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]\cdot\\ &\qquad\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]^{-1}\boldsymbol{Gx}(k)\\ &=-\left[\boldsymbol{Q}_2(k)+\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{H}\right]^{-1}\boldsymbol{H}^T\boldsymbol{P}(k+1)\left[\boldsymbol{I}+\boldsymbol{H}\boldsymbol{Q}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]\cdot\\ &\qquad\left[\boldsymbol{I}+\boldsymbol{HQ}_2^{-1}(k)\boldsymbol{H}^T\boldsymbol{P}(k+1)\right]^{-1}\boldsymbol{Gx}(k)\\ &=-\left[\boldsymbol{Q}_2(k)+\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{H}\right]^{-1}\boldsymbol{H}^T\boldsymbol{P}(k+1)\boldsymbol{Gx}(k) \end{aligned}$

4. 连续时间系统最优控制的离散化处理

设连续系统状态空间方程为：
$\begin{cases} \dot{\boldsymbol{x}}(t)=\boldsymbol{f}\left[\boldsymbol{x}(t),\boldsymbol{u}(t),t\right]\\ \boldsymbol{x}(t_0)=\boldsymbol{x}_0 \end{cases}$

目标函数为：
$J=\int_{t_0}^{t_f}L\left[\boldsymbol{x}(t),\boldsymbol{u}(t),t\right]\textrm{d}t+\varPhi\left[\boldsymbol{x}(t_f)\right]$

这里假定 $\boldsymbol{x}(t_f)$ 是自由终端， $\varPhi[\boldsymbol{x}(t_f)]$ 是终端代价函数。

如果按照 $\Delta t$ 为采样周期对系统直接进行离散化，就可以将该问题转化为静态最优控制问题：
$\begin{cases} \boldsymbol{f}\left[\boldsymbol{x}(k\Delta t),\boldsymbol{u}(k\Delta t),k\Delta t\right]\Delta t-\left[\boldsymbol{x}(k\Delta t+\Delta t)-\boldsymbol{x}(k\Delta t)\right]=\boldsymbol{0},(k=0,1,\cdots,\frac{t_f}{\Delta t}-1)\\ J=\displaystyle\sum_{k=0}^{\frac{t_f}{\Delta t}-1}L\left[\boldsymbol{x}(k\Delta t),\boldsymbol{u}(k\Delta t),k\Delta t\right]\Delta t+\varPhi\left[\boldsymbol{x}(t_f)\right] \end{cases}\\ \Rightarrow\begin{cases} \boldsymbol{f}\left[\boldsymbol{x}(k),\boldsymbol{u}(k),k\right]\Delta t-\left[\boldsymbol{x}(k+1)-\boldsymbol{x}(k)\right]=\boldsymbol{0},(k=0,1,\cdots,N-1)\\ J=\displaystyle\sum_{k=0}^{N-1}L\left[\boldsymbol{x}(k),\boldsymbol{u}(k),k\right]\Delta t+\varPhi\left[\boldsymbol{x}(N)\right] \end{cases}$

计算出该问题以后考虑 $\Delta t\to0$ 的极限情况就可以确定连续系统的最优解。

还是和前面一样采用相似的定义：
$\begin{aligned} H_k&=L_k\left[\boldsymbol{x}(k),\boldsymbol{u}(k)\right]+\boldsymbol{\lambda}^T(k+1)\boldsymbol{f}_k\left[\boldsymbol{x}(k),\boldsymbol{u}(k)\right]\\ V&=\varPhi[\boldsymbol{x}(N)]+\sum_{k=0}^{N-1}\left\{L_k\left[\boldsymbol{x}(k),\boldsymbol{u}(k)\right]\Delta t+\boldsymbol{\lambda}^T(k+1)\left[\boldsymbol{f}_k[\boldsymbol{x}(k),\boldsymbol{u}(k)]\Delta t-\boldsymbol{x}(k+1)+\boldsymbol{x}(k)\right]\right\}\\ &=\varPhi[\boldsymbol{x}(N)]+\sum_{k=0}^{N-1}\left\{H_k\Delta t-\boldsymbol{\lambda}^T(k+1)\left[\boldsymbol{x}(k+1)-\boldsymbol{x}(k)\right]\right\}\\ &=\varPhi[\boldsymbol{x}(N)]+\boldsymbol{\lambda}^T(1)\boldsymbol{x}(0)+H_0\Delta t-\boldsymbol{\lambda}^T(N)\boldsymbol{x}(N)+\sum_{k=1}^{N-1}\left[H_k\Delta t+(\boldsymbol{\lambda}^T(k+1)-\boldsymbol{\lambda}^T(k))\boldsymbol{x}(k)\right] \end{aligned}$

可以得到极值条件为：
$\begin{cases} \displaystyle\frac{\partial V}{\partial\boldsymbol{x}(k)}=\frac{\partial H_k}{\partial\boldsymbol{x}(k)}\Delta t+\left[\boldsymbol{\lambda}(k+1)-\boldsymbol{\lambda}(k)\right]=\boldsymbol{0},(k=1,2,\cdots,N-1)\\ \displaystyle\frac{\partial V}{\partial\boldsymbol{x}(N)}=\frac{\partial\varPhi[\boldsymbol{x}(N)]}{\partial\boldsymbol{x}(N)}-\boldsymbol{\lambda}(N)=\boldsymbol{0}\\ \displaystyle\frac{\partial V}{\partial\boldsymbol{u}(k)}=\frac{\partial H_k}{\partial\boldsymbol{u}(k)}\Delta t=\boldsymbol{0},(k=0,1,\cdots,N-1)\\ \displaystyle\frac{\partial V}{\partial\boldsymbol{\lambda}(k)}=\boldsymbol{f}_{k-1}[\boldsymbol{x}(k-1),\boldsymbol{u}(k-1)]-\boldsymbol{x}(k)+\boldsymbol{x}(k-1)=\boldsymbol{0},(k=1,2,\cdots,N) \end{cases}$

取极限 $\Delta t\to0$ 可以得到最优控制问题的必要条件：
$\begin{cases} \displaystyle\frac{\partial H(t)}{\partial\boldsymbol{x}(t)}=-\dot{\boldsymbol{\lambda}}(t)\\ \displaystyle\frac{\partial\varPhi[\boldsymbol{x}(t_f)]}{\partial\boldsymbol{x}(t)}=\boldsymbol{\lambda}(t_f)\\ \displaystyle\frac{\partial H(t)}{\partial\boldsymbol{u}(t)}=\boldsymbol{0}\\ \dot{\boldsymbol{x}}(t)=\boldsymbol{f}\left[\boldsymbol{x}(t),\boldsymbol{u}(t),t\right] \end{cases}$

其中， $H(t)=L\left[\boldsymbol{x}(t),\boldsymbol{u}(t),t\right]+\boldsymbol{\lambda}^T(t)\boldsymbol{f}\left[\boldsymbol{x}(t),\boldsymbol{u}(t),t\right]$ 。

于灯火阑珊处

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
最优控制（一）——最优控制问题概述和静态最优问题的解

最优控制（一）——最优控制问题概述和静态最优问题的解最优控制问题，其实就是一类最优化问题，如果优化过程中 x\boldsymbol{x}x 与时间无关，或在所讨论的时间范围内为常量，就将该最优化问题称为静态最优化问题，反之就称为动态最优化问题。显然，在最优控制领域中，被控对象的状态会随着时间而变化，因此属于动态最优化问题。在动态最优化问题中，目标函数不再是普通函数，而是时间函数的函数，称为泛函数，简称泛函。1. 研究最优控制的前提条件给出受控系统的动态描述，即状态空间表达式。明确控制作用域：
复制链接

扫一扫