笔记-最优控制理论1

最新推荐文章于 2025-01-27 12:40:06 发布

Leweslyh

最新推荐文章于 2025-01-27 12:40:06 发布

阅读量3.3k

点赞数 3

本文链接：https://blog.csdn.net/weixin_41235419/article/details/115164766

版权

本文概述了最优控制问题的基本要素，包括建立状态方程、确定边界条件和性能指标。讨论了根据终端时间与状态的固定、自由或约束情况的分类，以及如何利用庞特里亚金极小值原理和经典变分法求解最优控制。详细介绍了拉格朗日乘子（协态变量）的引入及其在状态方程、协态方程和控制方程中的作用。此外，还分析了终端时间自由时的横截条件，以及如何处理终端状态的约束。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最优控制问题：在满足系统方程的约束条件下，在容许控制域中确定一个最优控制律，使得系统状态从已知初态转移到要求的目标集，并使性能指标达到极值。

1）建立被控系统的状态方程
2）确定边界条件
3）选定性能指标
4）确定控制律的容许范围
5）按一定方法计算最优控制

庞特里亚金极小值原理、经典变分法

终端状态和终端时间分 $\times 3$ 类：

终端时间固定，终端状态固定、自由、约束。
– $t_f$ 给定， $\boldsymbol{x}(t_f)$ 固定，即 $\boldsymbol{x}(t_f) = \boldsymbol{x}_{t_f}$
– $t_f$ 给定， $\boldsymbol{x}(t_f)$ 自由，就是无约束
– $t_f$ 给定， $\boldsymbol{x}(t_f)$ 受约束，即 $\boldsymbol{G} \left[ \boldsymbol{x}(t_f), t_f \right] = 0$
终端时间自由，终端状态固定、自由、约束。
– $t_f$ 自由， $\boldsymbol{x}(t_f)$ 固定，即 $\boldsymbol{x}(t_f) = \boldsymbol{x}_{t_f}$
– $t_f$ 自由， $\boldsymbol{x}(t_f)$ 自由，就是无约束
– $t_f$ 自由， $\boldsymbol{x}(t_f)$ 受约束，即 $\boldsymbol{G} \left[ \boldsymbol{x}(t_f), t_f \right] = 0$

性能指标分3类：

$\quad$ – 波尔扎(Bolza)型(综合指标)： $\psi \left( \boldsymbol{x}(t_f), t_f \right) + \int_{t_0}^{t_f} {L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] {\rm{d}} t}$

$\quad$ – 迈耶尔(Mayer)型(终端指标)： $\psi \left( \boldsymbol{x}(t_f), t_f \right)$

$\quad$ – 拉格朗日(Lagrange)型(积分指标)： $\int_{t_0}^{t_f} {L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] {\rm{d}} t}$

经典变分法

考虑动态系统：
$\dot{\boldsymbol{x}} = \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] \tag{1}$

性能指标为：
$\psi \left( \boldsymbol{x}(t_f), t_f \right) + \int_{t_0}^{t_f} {L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] {\rm{d}} t} \tag{2}$

求最优控制 $\boldsymbol{u}^*(t)$ 和满足状态方程的极值轨线 $\boldsymbol{x}^*(t)$ ，使性能指标取极值。

1）终端时刻固定，终端状态自由（ $t_f$ 给定， $\boldsymbol{x}(t_f)$ 自由）

将状态方程写成等式约束方程的形式：
$\boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] - \dot{\boldsymbol{x}} = 0 \tag{3}$

引入拉格朗日乘子 $\boldsymbol{\lambda}(t)$ ，又称为伴随变量、协态或共轭状态，增广泛函为：
$J_E = \psi \left( \boldsymbol{x}(t_f), t_f \right) + \int_{t_0}^{t_f} { \left \{ L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] + \boldsymbol{\lambda}^T(t) \left[ \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] - \dot{\boldsymbol{x}}(t) \right] \right \} {\rm{d}} t} \tag{4}$

这样就将有约束的泛函 $J$ 极值问题转换为无约束的增广泛函 $J_E$ 极值问题。

引入哈密顿（Hamilton）函数：
$H(\boldsymbol{x}(t), \boldsymbol{u}(t), \boldsymbol{\lambda}(t), t) = L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] + \boldsymbol{\lambda}^T(t) \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] \tag{5}$

那么式 $(4)$ 可以表示为：
$J_E = \psi \left( \boldsymbol{x}(t_f), t_f \right) + \int_{t_0}^{t_f} { \left[ H(\boldsymbol{x}(t), \boldsymbol{u}(t), \boldsymbol{\lambda}(t), t) - \boldsymbol{\lambda}^T(t) \dot{\boldsymbol{x}}(t) \right] {\rm{d}} t} \tag{6}$

注释1：没有给出各向量变量的维度，性能指标泛函是标量。

对式 $(6)$ 积分括号里的第二项 $\boldsymbol{\lambda}^T(t) \dot{\boldsymbol{x}}(t)$ 做分部积分，可得：
$\begin{aligned} J_E &= \psi \left( \boldsymbol{x}(t_f), t_f \right) - \boldsymbol{\lambda}^T(t_f) \boldsymbol{x}(t_f) + \boldsymbol{\lambda}^T(t_0) \boldsymbol{x}(t_0) \\ &+ \int_{t_0}^{t_f} { \left[ H(\boldsymbol{x}(t), \boldsymbol{u}(t), \boldsymbol{\lambda}(t), t) - \dot{\boldsymbol{\lambda}}^T(t) \boldsymbol{x}(t) \right] {\rm{d}} t} \end{aligned} \tag{7}$

设 $\boldsymbol{x}(t), \boldsymbol{u}(t)$ 相对于最优值 $\boldsymbol{x}^*(t), \boldsymbol{u}^*(t)$ 的变分分别为 $\delta \boldsymbol{x}(t), \delta \boldsymbol{u}(t)$ ，由于终端状态自由，还要考虑变分 $\delta \boldsymbol{x}(t_f)$ ，则由这些变分引起的泛函变分为：
$\begin{aligned} \delta{J_E} &= \delta \boldsymbol{x}^T (t_f) \frac{\partial{\psi}}{\partial{\boldsymbol{x}(t_f)}} - \delta \boldsymbol{x}^T(t_f) \boldsymbol{\lambda}(t_f) + \int_{t_0}^{t_f} { \left[ \delta \boldsymbol{x}^T \left( \frac{\partial{H}}{\partial{\boldsymbol{x}}} + \dot{\boldsymbol{\lambda}} \right) + \delta \boldsymbol{u}^T \frac{\partial{H}}{\partial{\boldsymbol{u}}} \right] {\rm{d}} t} \end{aligned} \tag{8}$

$J_E$ 为极值的必要条件是：对任意的 $\delta{\boldsymbol{x}}, \delta{\boldsymbol{u}}, \delta{\boldsymbol{x}(t_f)}$ ，变分 $\delta{J_E} = 0$ 。

综述所述，可得：

状态方程： $\dot{\boldsymbol{x}} = \frac{\partial{H}}{\partial{\boldsymbol{\lambda}}} = \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right]$

协态方程： $\dot{\boldsymbol{\lambda}} = - \frac{\partial{H}}{\partial{\boldsymbol{x}}}$

控制方程： $\frac{\partial{H}}{\partial{\boldsymbol{u}}} = 0$

横截条件： $\boldsymbol{\lambda}(t_f) = \frac{\partial{\psi}}{\partial{\boldsymbol{x}(t_f)}}$

横截条件表示协态终端所需满足的条件。当终端状态固定时， $\delta{\boldsymbol{x}(t_f)} = 0$ ，就不需要横截条件了。

注释2：状态方程+协态方程=正则方程

只知道初值 $\boldsymbol{x}(t_0)$ 和由横截条件确定的协态终端值 $\boldsymbol{\lambda}(t_f)$ ，即两点边值问题，一般很难求解。这是因为 $\boldsymbol{\lambda}(t_0)$ 未知，如果假定一个 $\boldsymbol{\lambda}(t_0)$ ，正向积分方程组，则在 $t = t_f$ 时的 $\boldsymbol{\lambda}$ 一般与给定的 $\boldsymbol{\lambda}(t_f)$ 不同，可反复修改 $\boldsymbol{\lambda}(t_0)$ 的值，直至 $\boldsymbol{\lambda}(t_f)$ 与给定值的差可以忽略不计为止。

2）终端时刻自由，终端状态受约束（ $t_f$ 自由， $\boldsymbol{x}(t_f)$ 属于一个约束集）

设终端状态满足约束方程：
$\boldsymbol{G} \left[ \boldsymbol{x}(t_f), t_f \right] = 0 \tag{9}$

其中， $\boldsymbol{G} \left[ \boldsymbol{x}(t_f), t_f \right] = \left[ G_1 \left( \boldsymbol{x}(t_f), t_f \right), \cdots , G_q \left( \boldsymbol{x}(t_f), t_f \right) \right]^T$

性能指标为：
$\psi \left( \boldsymbol{x}(t_f), t_f \right) + \int_{t_0}^{t_f} {L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] {\rm{d}} t}$

与上面例子类似，引入n维拉格朗日乘子向量 $\boldsymbol{\lambda}$ 和q维拉格朗日乘子向量 $\boldsymbol{v}$ ，做增广泛函：
$J_E = \psi \left( \boldsymbol{x}(t_f), t_f \right) + \boldsymbol{v}^T \boldsymbol{G} \left( \boldsymbol{x}(t_f), t_f \right) \\ +\int_{t_0}^{t_f} { \left \{ L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] + \boldsymbol{\lambda}^T(t) \left[ \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] - \dot{\boldsymbol{x}}(t) \right] \right \} {\rm{d}} t} \tag{10}$

引入哈密顿函数：
$H(\boldsymbol{x}(t), \boldsymbol{u}(t), \boldsymbol{\lambda}(t), t) = L \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] + \boldsymbol{\lambda}^T(t) \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right] \tag{11}$

令
$\boldsymbol{\Theta} (\boldsymbol{x}(t_f), t_f) = \psi \left( \boldsymbol{x}(t_f), t_f \right) + \boldsymbol{v}^T \boldsymbol{G} \left( \boldsymbol{x}(t_f), t_f \right) \tag{12}$

式 $(10)$ 可以表示为：
$J_E = \boldsymbol{\Theta} (\boldsymbol{x}(t_f), t_f) + \int_{t_0}^{t_f} { \left[ H(\boldsymbol{x}(t), \boldsymbol{u}(t), \boldsymbol{\lambda}(t), t) - \boldsymbol{\lambda}^T(t) \dot{\boldsymbol{x}}(t) \right] {\rm{d}} t} \tag{13}$

与 $t_f$ 固定时不同的地方在于，现在 $\delta J_E$ 由 $\delta \boldsymbol{x}(t), \delta \boldsymbol{u}(t), \delta \boldsymbol{x}(t_f), \delta{t_f}$ 所引起。这里， $\delta{t_f}$ 不再为0，并且：
$\begin{aligned} t_f &= t_f^* + \delta{t_f} \\ \delta \boldsymbol{x} (t_f) &= \boldsymbol{x} (t_f) - \boldsymbol{x}^* (t_f^*) = \delta \boldsymbol{x} (t_f^*) + \left[ \boldsymbol{x} (t_f^* + \delta t_f) - \boldsymbol{x} (t_f^*) \right] \\ &\approx \delta \boldsymbol{x} (t_f^*) + \dot{\boldsymbol{x}} (t_f^*) \delta t_f \end{aligned}$

计算 $J_E$ 的变分（只计算至一阶小量）：
$\Delta J_E = \boldsymbol{\Theta}^* (\boldsymbol{x}(t_f) + \delta \boldsymbol{x}(t_f), t_f + \delta t_f) + \int_{t_0}^{t_f^* + \delta t_f} { \left[ H(\boldsymbol{x} + \delta \boldsymbol{x}, \boldsymbol{u} + \delta \boldsymbol{u}, \boldsymbol{\lambda}, t) - \boldsymbol{\lambda}^T(\dot{\boldsymbol{x}} + \delta \dot{\boldsymbol{x}}) \right]^* {\rm{d}} t} \\ - \boldsymbol{\Theta} \left( \boldsymbol{x}(t_f), t_f \right)^* - \int_{t_0}^{t_f^*} { \left[ H(\boldsymbol{x}, \boldsymbol{u}, \boldsymbol{\lambda}, t) - \boldsymbol{\lambda}^T \dot{\boldsymbol{x}} \right]^* {\rm{d}} t}$

将上式线性化：
$\delta J_E = \left[ \frac{\partial{\boldsymbol{\Theta}}}{\partial{\boldsymbol{x}}(t_f)} \right]^* \delta \boldsymbol{x}(t_f) + \left[ \frac{\partial{\boldsymbol{\Theta}}}{\partial{t_f}} \right]^* \delta t_f + \int_{t_0}^{t_f^*} \left[ \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{x} + \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{u} - \boldsymbol{\lambda}^T \delta \dot{\boldsymbol{x}} \right]^* \text{d} t \\ +\int_{t_f^*}^{t_f^* + \delta t_f} { \left[ H(\boldsymbol{x} + \delta \boldsymbol{x}, \boldsymbol{u} + \delta \boldsymbol{u}, \boldsymbol{\lambda}, t) - \boldsymbol{\lambda}^T(\dot{\boldsymbol{x}} + \delta \dot{\boldsymbol{x}}) \right]^* {\rm{d}} t} \tag{14}$

针对式 $(14)$ ，对于 $\int_{t_0}^{t_f^*} \left[ \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{x} + \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{u} - \boldsymbol{\lambda}^T \delta \dot{\boldsymbol{x}} \right]^* \text{d} t$ 这一项，采用分部积分法，可化为：
$\int_{t_0}^{t_f^*} \left[ \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{x} + \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{u} - \boldsymbol{\lambda}^T \delta \dot{\boldsymbol{x}} \right]^* \text{d} t \\ \Downarrow \\ \int_{t_0}^{t_f^*} \left[ \left( \frac{\partial H}{\partial \boldsymbol{u}} + \dot{\boldsymbol{\lambda}} \right)^T \delta \boldsymbol{x} + \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{u} \right]^* \text{d} t - \boldsymbol{\lambda}^T (t_f^*) \delta \boldsymbol{x} (t_f^*)$

对于 $\int_{t_f^*}^{t_f^* + \delta t_f} { \left[ H(\boldsymbol{x} + \delta \boldsymbol{x}, \boldsymbol{u} + \delta \boldsymbol{u}, \boldsymbol{\lambda}, t) - \boldsymbol{\lambda}^T(\dot{\boldsymbol{x}} + \delta \dot{\boldsymbol{x}}) \right]^* {\rm{d}} t}$ 这一项，忽略二阶小量，可化为：
$\int_{t_f^*}^{t_f^* + \delta t_f} { \left[ H(\boldsymbol{x} + \delta \boldsymbol{x}, \boldsymbol{u} + \delta \boldsymbol{u}, \boldsymbol{\lambda}, t) - \boldsymbol{\lambda}^T(\dot{\boldsymbol{x}} + \delta \dot{\boldsymbol{x}}) \right]^* {\rm{d}} t} \\ \Downarrow \text{一阶展开} \\ \approx \int_{t_f^*}^{t_f^* + \delta t_f} { \left[ H(\boldsymbol{x}, \boldsymbol{u}, \boldsymbol{\lambda}, t) + \left( \frac{\partial H}{\partial \boldsymbol{x}} \right)^T \delta \boldsymbol{x} + \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{u} - \boldsymbol{\lambda}^T \dot{\boldsymbol{x}} - \boldsymbol{\lambda}^T \delta \dot{\boldsymbol{x}} \right]^* {\rm{d}} t} \\ \Downarrow \text{忽略小量} \\ \approx H^* (\boldsymbol{x}, \boldsymbol{u},\boldsymbol{\lambda}, t) \delta t_f - \boldsymbol{\lambda}^T (t_f^*) \dot{\boldsymbol{x}}(t_f^*) \delta t_f \\ \Downarrow \text{合并整理} \\ = H^* \delta t_f - \boldsymbol{\lambda}^T (t_f^*) \left[ \delta \boldsymbol{x}(t_f) - \delta \boldsymbol{x}(t_f^*) \right]$

因此，式 $(14)$ 可以化为：
$\delta J_E = \left[ \frac{\partial{\boldsymbol{\Theta}}}{\partial{\boldsymbol{x}}(t_f)} \right]^* \delta \boldsymbol{x}(t_f) - \boldsymbol{\lambda}^T (t_f^*) \delta \boldsymbol{x} (t_f) + \left[ \frac{\partial{\boldsymbol{\Theta}}}{\partial{t_f}} \right]^* \delta t_f + H^* \delta t_f \\ + \int_{t_0}^{t_f^*} \left[ \left( \frac{\partial H}{\partial \boldsymbol{x}} + \dot{\boldsymbol{\lambda}} \right)^T \delta \boldsymbol{x} + \left( \frac{\partial H}{\partial \boldsymbol{u}} \right)^T \delta \boldsymbol{u} \right]^* \text{d} t \tag{15}$

$J_E$ 取极值的必要条件是：对任意的 $\delta{\boldsymbol{x}}, \delta{\boldsymbol{u}}, \delta{\boldsymbol{x}(t_f)}, \delta t_f$ ，变分 $\delta{J_E} = 0$ ，也就是说：

状态方程： $\dot{\boldsymbol{x}} = \frac{\partial{H}}{\partial{\boldsymbol{\lambda}}} = \boldsymbol{f} \left[ \boldsymbol{x}(t), \boldsymbol{u}(t), t \right]$

协态方程： $\dot{\boldsymbol{\lambda}} = - \frac{\partial{H}}{\partial{\boldsymbol{x}}}$

控制方程： $\frac{\partial{H}}{\partial{\boldsymbol{u}}} = 0$

横截条件： $\left \{ \begin{aligned} \boldsymbol{\lambda}(t_f) &= \frac{\partial \boldsymbol{\Theta}}{\partial{\boldsymbol{x}(t_f)}} = \frac{\partial{\psi}}{\partial{\boldsymbol{x}(t_f)}} + \frac{\partial \boldsymbol{G}^T}{\partial{\boldsymbol{x}(t_f)}} \boldsymbol{v} \\ H(t_f) &= - \frac{\partial \boldsymbol{\Theta}}{\partial{t_f}} = - \frac{\partial{\psi}}{\partial{t_f}} - \frac{\partial \boldsymbol{G}^T}{\partial{t_f}} \boldsymbol{v} \end{aligned} \right.$

终端时刻自由时，多了一个方程 $H(t_f) = - \frac{\partial \boldsymbol{\Theta}}{\partial{t_f}} = - \frac{\partial{\psi}}{\partial{t_f}} - \frac{\partial \boldsymbol{G}^T}{\partial{t_f}} \boldsymbol{v}$ ，用于求出最优终端时间。