泛函和变分：从最速降线谈起

本文链接：https://blog.csdn.net/lusongno1/article/details/107578068

泛函和变分：从最速降线谈起

处理最速降线等类似的问题，大家都喜欢直接对推导出来的极小化问题，直接代入欧拉-拉格朗日方程求解，我觉得这不易于对“变分”的理解，对于大家理论分析功底的增近，并无裨益。通过思考，我觉得直接从 Frechet 导数出发，进行变分推导得到更具化的欧拉-拉格朗日方程，是更为广泛的一种变分方法。本质上是一样的，只不过这个过程更容易推广。

文章目录

泛函和变分：从最速降线谈起

简介

所谓的泛函，就是“函数的函数”，自变量本身就是函数的一个函数。找一个函数，使得某一个泛函最小，就是一个“能量”极小化的问题。可以用到变分方法。

变分法在理论物理中非常重要：在拉格朗日力学中，以及在最小作用量原理在量子力学的应用中。
变分法提供了有限元方法的数学基础，它是求解边界值问题的强力工具。它们也在材料学中研究材料平衡中大量使用。
在纯数学中的例子有，黎曼在调和函数中使用狄力克雷原理。
最优控制的理论是变分法的一个推广。

变分法是 17 世纪末发展起来的一门数学分支，是处理函数的数学领域，和处理数的函数的普通微积分相对。它最终寻求的是极值函数：它们使得泛函取得极大或极小值。

变分

微分是当自变量 $x$ 变化了一点点 $\text{d}x$ 而导致了函数 $f (x)$ 变化了多少。
变分是无限维空间上的微分，我们一般称之为Frechet 微分，其实就是微分在无限维空间的推广。Frechet 微分作用于泛函就叫变分。我们用 $\delta$ 符号来替代微分中的 d。

Frechet 导数

Frechet 导数实变量函数在 Banach 空间中的推广，这个东西在做偏微分方程的时候，比如求能量极小，求欧拉-拉格朗日方程等方面，非常重要，任何做方程的，都应该熟练掌握。

Frechet 导数，就是一般导数的一个推广，可以简单地写为，对于需要极小化的函数 $J(\phi)$ ， $\forall \psi$ ：
$<\frac{\delta J}{\delta \phi},\psi> = \lim_{\epsilon->0}\frac{J(\phi+\epsilon\psi)-J(\phi)}{\epsilon}=\left.\frac{d}{d \varepsilon} J(\phi+\varepsilon \psi)\right|_{\varepsilon=0}$

Frechet 导数和一般的函数导数非常像，主要是这个对辅助函数 $\psi$ 的任意很关键，是把积分号去掉，提取出恒等式的原因。

最速降线问题

最速降线问题，又称最短时间问题、最速落径问题，是探讨在重力作用而忽略摩擦力的情况下，一个质点在一点A以速率为零开始，沿某条曲线，去到一点不高于A的B，该以何种曲线行进才能令所需的时间最短。由经验可知，这条线越陡，速度就会越快，但是相应的路径就会变长，路径和速度之间必然存在一个平衡。

在这里插入图片描述

如图所示建立坐标系，水平方向的运动距离为 $x$ ，竖直方向的运动距离为 $y$ ，速度的大小用 $v$ 来表示。

由高中的重力势能和动能的转化关系， $mgy=1/2mv^2$ 。可以得到，
$\sqrt{2gy}$

在微分几何中，一条参数化曲线 ${x(t),y(t)\}$ ，它的弧长是可以表示为：
$\int_{t_0}^{t_1}\sqrt{x'(t)^2+y'(t)^2}\text{d}t$
这个公式不需要记，怎么理解呢，它表示曲线沿 $x$ 方向的变化率，和沿 $y$ 方向的变化率，利用“勾股定理进行组合，得到的就是沿切线方向的变化率，沿切线方向的变化率，再做个积分，肯定就是长度了。

那么，对于曲线 $y (x)$ ，把 $x$ 看成 $t$ ，仍用 $x$ 表示，那么它的弧长就是
$\int_{a}^{b}\sqrt{1+y'(x)^2}\text{d}x$
接下来，有的地方就会利用“微元”的思想，把弧长和速度相除作为时间进行积分，对于不理解“微元法”的人来说，就会显得很牵强。那么应该怎么解释呢？

把弧长的表达式换成弧长参数，有
$\int_{a}^{b}\sqrt{1+y'(x)^2}\text{d}x= \int_{s_0}^{s_1}1\text{d}s$
也就是说，
$\text{d}s = \sqrt{1+y'(x)^2}\text{d}x$
这个是很容易理解的。那么，

$v=\frac{\text d s}{\text d t} = \sqrt{1+y'(x)^2}\frac{\text{d}x}{\text d t}$

则有，
$\text dt = \frac{\sqrt{1+y'(x)^2}}{v} \text dx$

两边同时积分，可以得到从 a 到 b 的总时间，

$\int_{a}^{b} \frac{\sqrt{1+y'(x)^2}}{\sqrt{2gy}} \text dx:= \int_{a}^{b} F \text dx$

变分求解最速降线

下面要做的就是选定 $y$ ，使得 $J$ 达到最小，这是经典的变分问题，我们使用变分方法。

$<\frac{\delta J}{\delta y},z> = \lim_{\epsilon->0}\frac{J(y+\epsilon z)-J(y)}{\epsilon}\\ =\lim_{\epsilon->0}\int_{a}^b \frac{\frac{\partial F}{\partial y}\epsilon z+\frac{\partial F}{\partial y'}\epsilon z'+o(\epsilon)}{\epsilon}\\ = \int_{a}^b \frac{\partial F}{\partial y}z+\frac{\partial F}{\partial y'}z'\\ ={\frac{\partial F}{\partial y'}z}|_a^{b}+\int_{a}^b (\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'})z\\ = \int_{a}^b (\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'})z = 0$

第二个等号用了泰勒展开，因为积分不好相消，这种情况下，我们一般更倾向于用泰勒展开。这里的 $y$ 和 $y^{'}$ 都应该看成一个变量，类比一般的多元函数泰勒展开。

第四个等号用了分部积分，对第二项进行了处理，一般含辅助函数 $z$ 的都可以进行分部积分处理掉。

第五个等式是因为， $y+\epsilon z$ 作为 y 的一个扰动，必须满足边界条件，即 $(y+\epsilon z)(a) = y (a)\\ (y+\epsilon z)(b) = y (b)$
这意味着 $z (a) = z (b) = 0$ 。最后，由于 $z$ 的任意性（端点固定不影响），我们有，
$\frac{\partial F}{\partial y}+\frac{\text d}{\text dx}\frac{\partial F}{\partial y'} = 0$

这便是我们得到的欧拉-拉格朗日方程。由于 $F$ 中不显含自变量，则，
$\frac{d}{d x}\left[F-y^{\prime} \frac{\partial F}{\partial y^{\prime}}\right]=y^{\prime} \frac{\partial F}{\partial y}+y^{\prime \prime} \frac{\partial F}{\partial y^{\prime}}-y^{\prime \prime} \frac{\partial F}{\partial y^{\prime}}-y^{\prime} \frac{d}{d x}\left(\frac{\partial F}{\partial y^{\prime}}\right)=0$
故而
$F-y^{\prime} \frac{\partial F}{\partial y^{\prime}}=C$
将 $F$ 的表达式代入，并且化简，可以得到一个不显含 $x$ 的一个 ODE，
$y\left[1+\left(y^{\prime}\right)^{2}\right]=C$
这里的 C 是可以由边界条件得到。翻一翻常微分的课本，我们可以求解这个 ODE，得到：
$\left\{\begin{array}{l} x=a+r(\theta-\sin \theta) \\ y=r(1-\cos \theta) \end{array}\right.$

这里的 $r > 0$ ，表示摆线圆半径。这里的 $r$ 等于多少呢？假设 a、b两点的坐标分别为—— $a: (a,0)，b:(b,y_b)$ 。那么，可以求得： $\theta_0 = 0$ ， $\theta_1$ 和 $r$ 可以根据求解方程组
$\left\{\begin{array}{l} b=a+r(\theta_1-\sin \theta_1) \\ y_b=r(1-\cos \theta_1) \end{array}\right.$
得到。涉及到非线性方程的求根，解析的表达式并不好写。