变分法的基本概念

最新推荐文章于 2024-08-23 11:07:46 发布

EasonZzzzzzz

最新推荐文章于 2024-08-23 11:07:46 发布

阅读量945

点赞数 17

分类专栏：数学之美现代控制理论文章标签：算法学习

本文链接：https://blog.csdn.net/m0_72748751/article/details/135358173

版权

数学之美同时被 2 个专栏收录

16 篇文章 2 订阅

订阅专栏

现代控制理论

5 篇文章 0 订阅

订阅专栏

1、泛函

变分法是研究泛函极值问题的工具。泛函就是函数的函数，它是普通函数概念的一种补充。

首先回顾一下函数的概念：如果变量 $y$ 因 $x$ 的变化按某一确定的规律而变化，或者说，对应于 $x$ 定义域中的每一个 $x$ 值， $y$ 都有一个（或一组）确定的值与之对应，则称 $y$ 是 $x$ 的函数，记作 $y = f (x)$ 。这里宗量 $x$ 是独立自变量，而 $y$ 是因变量。

与函数概念相对应，可以这样来阐明泛函的概念：如果一个因变量，它的宗量不是独立自变量，而是另一些独立自变量的函数，则称该因变量为这个宗量函数的泛函。或者说，对应于某一类函数中的每一个确定的函数 $y (x)$ （注意，不是函数值），因变量 $J$ 都有一确定的值（注意，不是函数）与之对应，则称因变量 $J$ 为宗量函数 $y (x)$ 的泛函数，简称泛函。记作 $J = J [y (x)]$ 或简记为 $J$ 。应该强调的是这个记号中的 $y (x)$ 应理解为某一特定函数的整体，而不是对应于 $x$ 的函数值 $y (x)$ ，因此有时又记作 $J=J[y(\cdot)]$ 。
在这里插入图片描述

例如，在直角坐标平面中有两点 $A(x_a,y_a)$ 和 $B(x_b,y_b)$ ，连接这两点的曲线长度（弧长 $l$ ）是曲线函数 $y = y (x)$ 的泛函。因为当 $y = y (x)$ 一经确定，就可具体计算出 $A 、 B$ 两点间的弧长。

由弧长的微分：
$(\mathrm{d}l)^2=(\mathrm{d}x)^2+(\mathrm{d}y)^2$

得
$\dfrac{\mathrm{d}l}{\mathrm{d}x}=\sqrt{1+\Big(\dfrac{\mathrm{d}y}{\mathrm{d}x}\Big)^2}=\sqrt{1+\dot{y}^2}$

所以
$l=\int_{x_a}^{x_b}\sqrt{1+\dot{y}^2}\mathrm{d}x$

显然对不同得曲线 $y (x)$ ，就有不同得弧长 $l$ 与之对应，所以弧长 $l$ 是宗量函数 $y (x)$ 的泛函，记作 $J [y (x)]$ ，即
$J[y(x)]=\int_{x_a}^{x_b}\sqrt{1+\dot{y}^2}\mathrm{d}x=\int_{x_a}^{x_b}L(\dot{y})\mathrm{d}x$

一般地， $L$ 也是 $x, y$ 的函数，因此应写成：
$J=\int_{x_a}^{x_b}L(y,\dot{y},x)\mathrm{d}x\tag{1}$

很显然，两点间的最短弧长应是直线 $y^\ast(x)$ ，即
$l_{min}=J^\ast=\min J[y(x)] = J[y^\ast(x)]$

在控制系统中，自变量是时间 $t$ ，宗量函数是状态矢量 $\pmb{x}(t)$ ，因此式（1）可写成
$J=\int_{x_a}^{x_b}L(x,\dot{x},t)\mathrm{d}t$

又因 $\dot{\pmb{x}}(t)=\pmb{f}[\pmb{x}(t),\pmb{u}(t),t]$ ，所以 $J$ 又可写成
$J=\int_{t_0}^{t_f}L[\pmb{x}(t),\pmb{u}(t),t]\mathrm{d}t$

这就是积分型性能泛函。 $J$ 的值取决于函数 $\pmb{u}(t)$ ，不同的函数 $\pmb{u}(t)$ ，有不同的 $J$ 值与之相对应，所以， $J$ 是函数 $\pmb{u}(t)$ 的泛函，所谓求最优控制 $\pmb{u}^\ast(t)$ ，就是寻求使性能泛函 $J$ 取极值时的控制 $\pmb{u}(t)$ 。

综上可见，泛函与函数的区别，仅在于泛函的宗量是函数，而函数的宗量是变数。

2、泛函的极值

求泛函的极大值或极小值问题称为变分问题。求泛函极值的方法称为变分法。

如果泛函 $J [y (x)]$ 在任何一条与 $y_0(x)$ 接近的曲线上所取得值不小于 $J[y_0(x)]$ ，即
$\Delta J=J[y(x)]-J[y_0(x)]\geq0$

则成泛函 $J [y (x)]$ 在 $y_0(x)$ 曲线上达到了极小值。反之，达到了极大值。

何谓两个函数的接近呢？在函数中，说自变量 $x$ 接近于 $x_0$ ，不外乎只有两个方向，一个是沿着 $x$ 轴的左边接近，另一个是沿着 $x$ 轴的右边接近。但是泛函的宗量是函数，说两个函数接近，问题就没这样简单。如果对于定义域中的一切 $x$ ，下式都成立：
$|y(x)-y_0(x)|\leq\varepsilon$

其中 $\varepsilon$ 是一正的小量，则称函数 $y (x)$ 与 $y_0(x)$ 有零阶接近度。如图所示，具有零阶接近度的两条曲线的形状可能差别很大。
在这里插入图片描述
如果不仅是函数值，而且它的各阶导数也很接近，即满足：
$\begin{cases} |y(x)-y_0(x)|\leq\varepsilon\\[2ex] |y^\prime(x)-y^\prime_0(x)|\leq\varepsilon\\[2ex] |y^{\prime\prime}(x)-y^{\prime\prime}_0(x)|\leq\varepsilon\\[2ex] \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \vdots\\[2ex] |y^{k}(x)-y^{k}_0(x)|\leq\varepsilon \end{cases}$

则称 $y (x)$ 与 $y_0(x)$ 有 $k$ 阶接近度，如图可见，接近度阶次越高，表明函数的接近程度越好。
在这里插入图片描述

3、泛函的变分

泛函的增量可表示为：
$\begin{aligned} \Delta J &= J[y(x)+\delta y(x)]-J[y(x)]\\ &=L[y(x),\delta y(x)]+R[y(x),\delta y(x)] \end{aligned}\tag{2}$

式中， $\delta y(x)=y(x)-y_0(x)$ 为宗量 $y (x)$ 的变分； $L[y(x),\delta y(x)]$ 为 $\delta y(x)$ 的线性连续泛函； $R[y(x),\delta y(x)]$ 为 $\delta y(x)$ 的高阶无穷小项。

定义泛函增量的线性主部：
$\delta J=L[y(x),\delta y(x)]\tag{3}$

为泛函的变分。若泛函有变分，而且增量 $\Delta J$ 可用式（2）表达时，则称泛函是可微的。

泛函的变分也可定义为：
$\delta J=\dfrac{\partial}{\partial \alpha}J[y(x)+\alpha\delta y(x)]\Big|_{\alpha=0}\tag{4}$

实际上，二者是一致的。即
$\dfrac{\partial}{\partial \alpha}J[y(x)+\alpha\delta y(x)]\Big|_{\alpha=0}=L[y(x),\delta y(x)]$

根据式（4）利用函数的微分法则可方便地进行泛函变分的计算。

证明：

泛函增量可以表示成：
$\Delta J = J[y(x)+\alpha\delta y(x)] - J[y(x)] = L[y(x),\alpha\delta y(x)]+R[y(x),\alpha\delta y(x)]$

式中， $L[y(x),\alpha\delta y(x)]$ 为关于 $\alpha\delta y(x)$ 的线性连续泛函，因此有
$L[y(x),\alpha\delta y(x)]=\alpha L[y(x),\delta y(x)]$

又由于 $R[y(x),\alpha\delta y(x)]$ 是关于 $\alpha\delta y(x)$ 的高阶无穷小量，所以有：
$\lim_{\alpha\rightarrow0}\dfrac{R[y(x),\alpha\delta y(x)]}{\alpha}=\lim_{\alpha\rightarrow0}\dfrac{R[y(x),\alpha\delta y(x)]}{\alpha\delta y(x)}\delta y(x)=0$

考虑到以上两点，便得到：
$\begin{aligned} &\dfrac{\partial}{\partial\alpha}J[y(x)+\alpha\delta y(x)]\Big|_{\alpha=0}=\lim_{\alpha\rightarrow0}\dfrac{\Delta J}{\alpha}\\[2ex] &=\lim_{\alpha\rightarrow0}\dfrac{J[y(x)+\alpha\delta y(x)]-J[y(x)]}{\alpha}\\[2ex] &=\lim_{\alpha\rightarrow0}\dfrac{1}{\alpha}\{\alpha L[y(x),\delta y(x)]\}\\[2ex] &=L[y(x),\delta y(x)] \end{aligned}$

例：求下列泛函的变分：
$J=\int_{t_0}^{t_f}x^2(t)\mathrm{d}t$

解：由式（2）得
$\begin{aligned} \Delta J&=\int_{t_0}^{t_f}[x(t)+\delta x(t)]^2\mathrm{d}t-\int_{t_0}^{t_f}x^2(t)\mathrm{d}t\\[2ex] &=\int_{t_0}^{t_f}2x(t)\delta x(t)\mathrm{d}t + \int_{t_0}^{t_f}[\delta x(t)]^2\mathrm{d}t \end{aligned}$

线性主部为： $L[x(t),\delta x(t)]=\int_{t_0}^{t_f}2x(t)\delta x(t)\mathrm{d}t$

根据式（3）得变分：
$\delta J = \int_{t_0}^{t_f}2x(t)\delta x(t)\mathrm{d}t$

另一方面，亦可由式（4）得：
$\begin{aligned} \delta J &= \dfrac{\partial}{\partial\alpha}J[y(x)+\alpha\delta y(x)]\Big|_{\alpha=0}=\int_{t_0}^{t_f}\dfrac{\partial}{\partial\alpha}[x(t)+\alpha\delta x(t)]^2\mathrm{d}t\Big|_{\alpha=0}\\[2ex] &=\int_{t_0}^{t_f}2[x(t)+\alpha\delta x(t)]\delta x(t)\mathrm{d}t\Big|_{\alpha=0}=\int_{t_0}^{t_f}2x(t)\delta x(t)\mathrm{d}t \end{aligned}$

可见，二者结果是一致的。

4、泛函极值定理

定理： $\quad$ 若可微泛函 $J [y (x)]$ 在 $y_0(x)$ 上达到极值，则在 $y=y_0(x)$ 上得变分等于零。即
$\delta J=0$

证明： $\quad$ 已知 $J[y_0(x)]$ 是泛函极值。考察对极值曲线 $y_0(x)$ 或得增量 $\delta y$ 后得泛函，设宗量变分 $\delta y$ 任意取定不变，则 $J[y_0(x)+\alpha\delta y(x)]$ 便是实变量 $\alpha$ 的函数，即
$\varphi(\alpha)=J[y_0(x)+\alpha\delta y(x)]$

将 $\varphi(\alpha)$ 对 $\alpha$ 求导数，并令 $\alpha=0$ ，于是根据泛函变分的定义有
$\dot{\varphi}(\alpha)\Big|_{\alpha=0}=\dfrac{\partial}{\partial\alpha}J[y_0(x)+\alpha\delta y(x)]\Big|_{\alpha=0}=\delta J[y_0(x)]$

另一方面，对函数 $\varphi(\alpha)$ ，当 $\alpha=0$ 时，有 $\varphi(0)=J[y_0(x)]$ 已知是极值，根据函数极值定理必满足条件
$\dot{\varphi}(\alpha)\Big|_{\alpha=0}=0$

因此， $\delta J[y_0(x)]=0$ 成立，定理得证。

上述概念同样适用于多元函数，多元函数取极值的必要条件仍然是
$\delta J = 0$

EasonZzzzzzz

关注

17
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
变分法的基本概念

1、泛函变分法是研究泛函极值问题的工具。泛函就是函数的函数，它是普通函数概念的一种补充。首先回顾一下函数的概念：如果变量 yyy 因 xxx 的变化按某一确定的规律而变化，或者说，对应于 xxx 定义域中的每一个 xxx 值，yyy 都有一个（或一组）确定的值与之对应，则称 yyy 是 xxx 的函数，记作 y=f(x)y=f(x)y=f(x)。这里宗量 xxx 是独立自变量，而 yyy 是因变量。与函数概念相对应，可以这样来阐明泛函的概念：如果一个因变量，它的宗量不是独立自变量，而是另一些独立自变量
复制链接

扫一扫

专栏目录