优化控制理论学习笔记——从“狄多女王的问题”到使用变分法进行泛函求解

Veronica1312

已于 2023-03-07 20:51:40 修改

阅读量431

点赞数

文章标签：学习算法动态规划

于 2023-02-23 20:10:02 首次发布

本文链接：https://blog.csdn.net/weixin_44169614/article/details/129181954

版权

文章目录

引子
泛函介绍
求解方法
- Lagrangian formalism
- Hamiltonian formalism (Pontryagain principle)
总结

引子

古罗马诗人维吉尔（Virgil）在他的诗集《埃涅阿斯纪》（Aeneas）中讲述了一个故事：

迦太基的女王狄多，曾经为了躲避其兄皮格马利翁的追捕，从推罗城逃至北非，当她上岸后，与当地酋长进行了一笔交易：买下一块牛皮能够容纳的全部土地。随后她选了一头牛，将牛皮切成细丝再连接起来，沿着地中海的海岸线围出了一个半圆形王国，取名叫作Byrsa，意为牛皮，之后又在其中建立了迦太基城。

这个故事告诉我们，狄多女王的数学不错，明白定周长的图形中，圆形面积最大这个道理。然而在我们的认知中，一般只会将圆形和与其等周长的长方形、正方形等图案进行面积比较，使用的都是较为固定的面积公式。那么对于没有面积公式的任意图形，如何严格证明其面积小于与其等周长的圆形。或者说，如何严格证明沿着半圆的边长轨迹前进与横轴围成的图形面积最大。
如何计算任意形状图形的面积？
要解决这个问题，我们首先把它用数学的语言描述出来，其中涉及两个关键的指标——面积和周长，感谢牛顿等前人数学家，他们经过努力后，已经把这两个公式定义写出来了，分别是：
$S=\int_a^b f(x) {\rm d}x\\ L=\int_a^b \sqrt{1+[f'(x)]^2} {\rm d}x$ 现在我们可以利用这两个公式，把问题转化成数学语言来描述，即变成一个函数求极值问题：
$\max \ J=\int_a^b f(x) {\rm d}x\\ s.\ t. \ \int_a^b \sqrt{1+f'(x)} {\rm d}x=L$ 然而需要注意的是，与一般的函数求极值问题不同，这里的自变量 $f (x)$ 不是一个具体的数值，而是一个函数，或者说是一个表示图形轨迹的点序列，由此该问题进入了一个新的领域——泛函求解。

泛函介绍

泛函（functional），是函数的函数，推广开来说，就是一种从函数空间的映射，例如 $x$ 和 $f (x)$ 都是数值的矢量集合，而 $J$ 是一个标量值。为了对泛函进行求解，使用基于欧拉-拉格朗日方程（E-L方程）的变分法。

对于泛函
$S=\int_{x_1}^{x_2} L(f(x),f'(x),x) {\rm {d} }x$ （中间的推导省略了，相关资料非常丰富）
存在
$\frac{\partial L}{\partial g}-\frac{\rm d}{{\rm{d}}x} \frac{\partial L}{\partial g'}=0\\ g=\argmax_{f(x)} S \ 或\ g=\argmin_{f(x)} S$ 其中的 $g$ 表示泛函 $S$ 取到极值时的 $f (x)$ 取值，这里也隐藏了一个条件，就是泛函必然存在极值，才能使用E-L公式求解，如果是在空间内找到了泛函的极值点，只要是极点无所谓到底是极大值还是极小值，求解方法都一样。

求解方法

基于E-L方程，主要的求解方法可以分为两类：拉格朗日形式和汉密尔顿形式（庞特里亚金原则），二者在构造问题的方法上略有不同，我们分别用两种方法求解一下定周长图形中圆形面积最大证明问题。

Lagrangian formalism

拉格朗日形式的问题描述如下：
$\max \int_a^b F(f(t),f'(t),t) {\rm d}t\\ s.t.\ \int_a^b {\bf G}(f(t),f'(t),t) {\rm d}t=0\\$ 不同的情况下， $G$ 可以是单个函数或多个约束函数的集合向量，根据条件构建以下函数：
$y=f(t)\\ u=y'=f'(t)\\ G(y,y',t)=\sqrt{1+[f'(t)]^2}=\sqrt{1+u^2}\\ \begin{cases} \dot{x}_1=y'=u\\ \dot{x}_2=G(y,y',t)=\sqrt{1+u^2}\\ \end{cases}$ 其中 $u$ , $y$ , $y^{'}$ 都是关于t的函数， $u$ 的最优值就是我们最终希望得到的解。
写出其拉格朗日形式：
$\begin{cases} L=y+\lambda^T {\bf g}\\ g_1=\dot{x}_1-u\\ g_2=\dot{x}_2-\sqrt{1+u^2} \end{cases}$ 由于约束有两个，所以函数 $g$ 有两个， $\lambda$ 也是两个取值，整理可得：
$L=y+\lambda^T {\bf g}=x_1+ \begin{bmatrix} \lambda_1 & \lambda_2 \end{bmatrix} \begin{bmatrix} \dot{x}_1-u \\ \dot{x}_2-\sqrt{1+u^2} \end{bmatrix}=x_1+\lambda_1( \dot{x}_1-u)+\lambda_2 ( \dot{x}_2-\sqrt{1+u^2} )$ 套用E-L公式：
$\begin{cases} \frac{\partial L}{\partial u}-\frac{\rm d}{{\rm{d}}t} \frac{\partial L}{\partial u'}=\frac{\partial L}{\partial u}=-\lambda_1-\lambda_2\frac{u}{\sqrt {1+u^2}}=0\\ \frac{\partial L}{\partial x_1}-\frac{\rm d}{{\rm{d}}t} \frac{\partial L}{\partial \dot{x}_1}=1-\dot{\lambda}_1=0\\ \frac{\partial L}{\partial x_2}-\frac{\rm d}{{\rm{d}}t} \frac{\partial L}{\partial \dot{x}_2}=0-\dot{\lambda}_2=0\\ \end{cases}$ 整理可得：
$\begin{cases} {\lambda}_1=t+C_1\\ {\lambda}_2=C_2\\ u=\frac{\lambda_1^2}{\lambda_2^2-\lambda_1^2} \end{cases}$ 考虑到边界情况，与横轴围成图案的轨迹必须在起始点和终止点与横轴相连（ $y = 0$ ），将边界条件带入：
$\begin{cases} x_1(a)=\int u {\rm d}t \vert_{t=a}=0\\ x_1(b)=\int u {\rm d}t \vert_{t=b}=0\\ x_2(a)=\int \sqrt{1+u^2}{\rm d}t \vert_{t=a}=0\\ x_2(b)=\int \sqrt{1+u^2}{\rm d}t \vert_{t=b}=L \end{cases}$ 将 $u$ 用 $t$ , $C_1$ ， $C_2$ 来表示，解出参数取值即可获得 $u (t)$ 的函数表达式，它应该是一个半圆形曲线的导数方程。

Hamiltonian formalism (Pontryagain principle)

汉密尔顿形式描述与拉格朗日形式相同，但是它不需要构造动态方程的变量（例如 $\dot{x}_1$ 和 $\dot{x}_2$ ），针对这道题，约束就少了一个。其形式可写为：
$g=\sqrt{1+(y')^2}\\ H=y+\lambda g=y+\lambda\sqrt{1+(y')^2}\\$ 套用E-L公式：
$\frac{\partial H}{\partial y}-\frac{\rm d}{{\rm{d}}t} \frac{\partial H}{\partial y'}=1-\frac{\rm d}{{\rm d}t}(\frac{\lambda y'}{\sqrt{1+(y')^2}})=0\\$ 令 $u = y^{'}$ ，整理一下写出微分方程：
$1=\frac{\rm d}{{\rm d}t}(\frac{\lambda y'}{\sqrt{1+(y')^2}})=\frac{\rm d}{{\rm d}t}(\frac{\lambda u}{\sqrt{1+u^2}})\\ \implies t+C_1=\frac{\lambda u}{\sqrt{1+u^2}}\\ \implies u=\frac{t+C_1}{\sqrt{\lambda^2-(t+C_1)^2}}\\$ 代入边界条件：
$\begin{cases} f(a)=\int u {\rm d}t \vert_{t=a}=0\\ f(b)=\int u {\rm d}t \vert_{t=b}=0\\ \int_a^b \sqrt{1+u^2}{\rm d}t=L\\ \end{cases}$ 解出 $\lambda$ 和 $C_1$ 即可。
即使不解出具体的参数值，也可以整理公式：
$y=\int u {\rm d}t=\int \frac{t+C_1}{\sqrt{\lambda^2-(t+C_1)^2}} {\rm d}t=-\sqrt{\lambda^2-(t+C_1)^2}+C2\\ \implies (y-C_2)^2+(t+C_1)^2=\lambda^2$ 当 $C_1$ ， $C_2$ 和 $\lambda$ 都是常数的时候， $t$ 和 $y$ 构成的图形是一个圆形。

总结

看起来很好理解，但实际上，并不是那么容易解出，以汉密尔顿形式举例：
$\int_a^b \sqrt{1+u^2}{\rm d}t =\int_{a}^{b} \frac{\lambda}{\sqrt{\lambda^2-(t+C_1)^2}} {\rm d}t =\int_{a+C_1}^{b+C_1} \frac{\lambda}{\sqrt{\lambda^2-t^2}} {\rm d}t =\int_{\frac{a+C_1}{\lambda}}^{\frac{b+C_1}{\lambda}}\frac{\lambda}{\sqrt{1-t^2}}{\rm d}t\\ \: \\ =\lambda\arcsin{t}\vert_{\frac{a+C_1}{\lambda}}^{\frac{b+C_1}{\lambda}}$ 通过联立前面的边界条件方程，可以解出 $C_1=-\frac{a+b}{2}$ ，因此未知参数只剩下 $\lambda$ 一个，将 $C_1$ 代入，由于 $\arcsin(x)$ 是奇函数，可得：
$\lambda\arcsin{t}\vert_{\frac{a-b}{2\lambda}}^{\frac{b-a}{2\lambda}} =\lambda(\arcsin{\frac{b-a}{2\lambda}}-\arcsin{\frac{a-b}{2\lambda}}) =2\lambda\arcsin{\frac{b-a}{2\lambda}}=L$ 这是一个超越函数，虽然将 $\lambda=\frac{L}{\pi}=\frac{a-b}{2}$ 代入方程等式成立（即 $\lambda$ ， $a - b$ 和 $L$ 分别对应半径、直径和圆周的一半），但没法用求解析解的方式以 $a 、 b 、 L$ 表示 $\lambda$ 的取值。这个问题我之后再研究研究，把用程序求解的过程也写上。