优化方法理论合集（1）——最简单问题

最新推荐文章于 2022-05-09 02:08:42 发布

高能阿博特

最新推荐文章于 2022-05-09 02:08:42 发布

阅读量381

点赞数 2

分类专栏：优化方法文章标签：算法

本文链接：https://blog.csdn.net/weixin_58399148/article/details/124069515

版权

优化方法专栏收录该内容

15 篇文章 14 订阅

订阅专栏

1. 问题背景

首先来看如何定义一个最优化问题。
一个最优化问题不可或缺4个条件：

优化器，在系统中起到优化的作用。
数学模型。系统的数学模型一般可以用以下形式描述：
$\begin{cases} \dot x_1 = f_1 \left( t, \vec x, \vec u \right) \\ \dot x_2 = f_2 \left( t, \vec x, \vec u \right) \\ \vdots \\ \dot x_m = f_n \left( t, \vec x, \vec u \right) \end{cases}$ 此种形式称为柯西形式。
性能指标，一般记为 $J$ ，它表征了以何种方式来衡量优化的程度。
一般地，性能指标 $J$ 还可以具有以下3种形式：
3.1) 拉格朗日形式：
$\int _{t_0} ^{t_k} F \left( t, \vec x, \dot {\vec x}, \vec u \right) dt \rightarrow extr., \quad t \in \left[ t_0, t_k \right]$ 其中 $e r t r$ 表示 $J$ 趋于极值； $F$ 为被积函数。
值得注意的是，整个积分部分 $\int _{t_0} ^{t_k} F dt$ 被称为泛函数。
拉格朗日形式最常见，多体现在对快速性有要求的系统中。如，对时间有要求（一般要求时间最短）的任务中就有
$\int _{t_0} ^{t_k} 1 dt = t_k - t_0 = \Delta t \rightarrow min$
3.2) 迈耶尔形式：
$\Phi \left( \vec x \left( t_0 \right), \vec x \left( t_k \right) \right) \rightarrow extr.$ 此种形式不是积分型的，因此称为端点型，仅取决于 $x(t_0)$ 与 $x(t_k)$ 两个边界值。
3.3) 波尔茨型：
$\int _{t_0} ^{t_k} F \left( t, \vec x, \dot {\vec x}, \vec u \right) dt + \Phi \left[ x(t_0), x(t_k) \right] \rightarrow extr.$ 这种形式是拉格朗日型和迈耶尔型的组合形式，既含有积分项，也含有端点项。
优化算法。这一部分即为重点部分，将在本次及后续笔记分享中逐一介绍。

2. 最简单问题

最简单问题示意图
如上图所示，设 $x^{\circ}(t)$ 为最优轨迹，起点为 $x(t_0)$ ，终点为 $x(t_k)$ 。任务目标是寻找一条最优路径，从 $x(t_0)$ 出发，到 $x(t_k)$ 截止（即穿过两点），并满足一定的其他要求或约束。

在寻找该最优路径的过程中，可能得到很多条连接起点和终点的轨迹，它们统称为曲线簇，具有以下形式：
$x^{\circ}(t) + \alpha \cdot \delta x(t) \tag{1}$ 其中 $\delta x(t)$ 是该最优轨迹的变分。
(1)式可以这样理解：所得到的曲线簇是在最优轨迹 $x^{\circ}(t)$ 基础上，进行不同程度的偏离得到的，偏移量即为变分 $\delta x(t)$ 。随着 $\alpha$ 取值不同，偏移量也不同，进而构成了一组曲线簇集合，而 $x^{\circ}(t)$ 正是其中最优的一条。

3. 欧拉公式

这里不加证明地引入欧拉公式：
$F_x - \frac{d}{dt} F_{\dot x} = 0 \tag{2}$ 其中 $F_x$ 为 $F$ 关于 $x$ 的导数， $F_{\dot x}$ 为 $F$ 关于 $\dot x$ 的导数。
欧拉方程是 $J$ 的极值存在的必要但非充分条件。

4. 具体算法步骤

下面列出最简单问题的具体算法步骤。

列出条件，包含如下部分：
1-1) 时间区间 $\in \left[ t_0, t_k \right]$ ；
1-2) 边界条件 $x(t_0), x(t_k)$ 共2个；
1-3) 拉格朗日判据：
$\int _{t_0} ^{t_k} F \left( t, x, \dot x \right)dt \rightarrow extr.$ 以上三点也是最简单问题不可或缺的3个条件，缺一不可。
算出偏导数，为欧拉方程做准备：
$\begin{aligned} F_x &= \frac{\partial F}{\partial x} \\ F_{\dot x} &= \frac{\partial F}{\partial \dot x} \end{aligned}$
写出欧拉方程：
$F_x - \frac{d}{dt} F_{\dot x} = 0$
用两个边界条件解欧拉方程。它是二阶微分方程，有唯一解。
证明解的唯一性。

5. 例题

设性能指标为
$\int _0 ^1 \left( x^2 + \tau ^2 \dot x ^2 \right)dt \rightarrow extr.$ 边界条件：
$\begin{cases} x(0) = 0\\ x(1) = x_1 \end{cases}$ 时间区间：
$\in \left[ 0, 1 \right]$ 要求找出最优的 $x^{\circ} (t)$ 。

解：

$\left( t, x, \dot x \right) = x^2 + \tau ^2 \dot x ^2$ 。
计算欧拉方程：
$\begin{aligned} F_x &= \frac{\partial F}{\partial x} = 2x \\ F_{\dot x} &= \frac{\partial F}{\partial \dot x} = 2 \tau ^2 \dot x \end{aligned}$ 代入欧拉方程
$F_x - \frac{d}{dt} F_{\dot x} = 0 \Longrightarrow 2x - 2 \tau ^2 \ddot x = 0$ 解得
$C_1 e^{ \frac{1}{\tau} t } + C_2 e ^{- \frac{1}{\tau} t } \tag{1}$ 由于 $C$ 取值不定，因此(1)式即为一组曲线簇。
为了确定 $C$ ，需要代入边界条件：
$\quad x(1) = x_1$ 解出
$\begin{cases} C_1 &= \frac{x_1}{e^{\frac{1}{\tau} - e^{- \frac{1}{\tau}}}} \\ C_2 &= - \frac{x_1}{e^{\frac{1}{\tau} - e^{- \frac{1}{\tau}}}} \end{cases}$ 那么就可以得到最优解
$x^{\circ} (t) = \frac{x_1}{e^{\frac{1}{\tau} - e^{- \frac{1}{\tau}}}} e^{ \frac{1}{\tau} t } - \frac{x_1}{e^{\frac{1}{\tau} - e^{- \frac{1}{\tau}}}} e ^{- \frac{1}{\tau} t }$
之前提到过，欧拉方程仅仅是必要条件，只能保证已经达到极值，但并不能指出是最大值还是最小值。因此，这里附加一个条件进行判别，称为拉格朗日条件：
若 $_{\dot x \dot x} = \frac{\partial ^2 F}{\partial \dot x ^2 } < 0$ ，则 $\rightarrow max$ ；
若 $_{\dot x \dot x} = \frac{\partial ^2 F}{\partial \dot x ^2 } > 0$ ，则 $\rightarrow min$ ；
若 $_{\dot x \dot x} = 0$ ，那么要么是欧拉方程解错了，要么是存在断点/不连续点。

6. 最简单问题的几种情形

$F (x, t)$ ，即 $F$ 中不含有 $\dot x$ 。此时欧拉方程变为
$F_x = 0$
$\left( \dot x, t \right)$ ，即 $F$ 中不含 $x$ 。此时欧拉方程变为
$\frac{d}{dt} F_{\dot x} = 0$ 即
$F_{\dot x} = const.$
$\left( x, \dot x \right)$ 中不含 $t$ 。此时欧拉方程变为
$\dot x F _{\dot x} = const.$