传送门https://zhuanlan.zhihu.com/yueaptx
变分法简介Part 1.(Calculus of Variations)
计算力学
关注他
283 人赞了该文章
- 泛函数 (Functionals)
简而言之,泛函数是函数的函数,即它的输入是函数,输出是实数。而这个输出值取决于一个或多个函数(输入)在一整个路径上的积分而非像一般函数一样取决于离散的变量。这样说可能还是比较抽象,不过坚持看到下文的Example 1就可以更好理解了。
通常在变分法中,泛函数是一个积分,记做。
其中我们想要通过选择被积函数来最大化或最小化泛函数
的值。同时我们称
为拉格朗日函数(Lagrange function)。
可以是函数
和
各阶导数的函数(以下
均简写成
)。为了说明方便,我们先姑且设
是
和
的函数,所以我们可以进一步将泛函数
写成:
积分里面我用分号;将和前面的
隔开代表
和
是
的函数。一般
和
的函数关系是已知的,所以想要最大或最小化泛函数,实际上是通过选择适当的函数
。
为了透彻理解这个概念,我们可以来看一个简单的例子。
Example 1.
一个最简单直观的例子是求两个固定点之间的最短路径。当然大家都知道两点之间直线最短,这里可以用变分法做出解释。
如上图所示路径是一任意路径,我们取区中一小段微元,可以容易计算微元断的长度为:
,即:
积分得到总的路径长度为:
这个例子中,是泛函数,
是拉格朗日函数
,我们想要找一个函数
使得泛函数
的值最小。这次Part 1.的任务就是为解决这个问题做准备。Part 2.中我们会用变分法证明这个
确实是直线的方程。
2. 泛函数的极值
这里重申下,泛函数在区间
上的值取决于积分路径的选择,即取决于函数
的选择。我们有理由假设存在一个这样的
,可以使得泛函数
取到极值。而在这个
附近的任意路径我们记做
。另外,我们假设
两阶可微。通过引入一个微小量
和一个任意可微函数
,我们可以用
表示
:
这样做的好处是对于一个给定的,我们可以通过改变
的值来得到无穷多的路径,同时对于任何
,当
的时候,
和
重合。
图像直观表示如下图:
由于在边界条件的限制,。这样就能保证
可以通过两个固定端点。
这时我们可以说,所对应的泛函数
的值是泛函数
的极值。我们可以进一步用
表示
:
虽然未知,但是根据之前的合理假设,
是一个存在的确定函数。所以根据上式,如果给定一个特定的
,
的变化只取决于
的变化。所以我们现在可以把
看做是
的函数。用泰勒展开公式将
在
处展开得到:
很明显,当时,
,带入上式可得到:
这里我们记,并称之为一阶变分。同理二阶变分为
。
(这里插一句变分和微分的区别。变分在上图的直观解释是和
在竖直方向上的距离,称之为
,所以这个差是在同一个x上计算的。而微分则是由于x的微小变动引起的y的变动。)
然后我们可以类比求函数极值时的做法。求函数极值时,我们会令函数的一阶导数为零。这里同样,为了求泛函数的极值,我们令一阶变分
。现在我们计算化简
:
因为 , 不难得到:
,
,另外我们有
又因为当时,
,将这些式子带入原式可以得到:
终于到最后一步啦,分部积分一下得到:
另就可以解得最小化泛函数的y啦。我们注意到
有两个部分。对于第一个积分部分,由于
是任意的,所以要想使这个部分等于零,需要保证
:
(
)
这就是传说中的欧拉-拉格朗日方程(E-L equation)。
而第二部分等于零则是边界条件。
在Part 2., 我们会以用这次介绍的内容和上述方程解决两点之间直线最短的问题为开头,继续介绍变分法。
---------------------------------------------------------------------------------------------------------------------------
注[1]:
假设和
是给定的常数,
是一个特定的在
上连续的函数,那么如果对于任意连续可微的函数
都成立
,则
(
)。
(任意函数和一个非零的特定函数的乘积仍是任意函数,由于无法保证任意函数的积分是零,所以这个特定函数必须在这个区间上恒等于零使得乘积为零,这样可以保证积分为零。)