泛函与泛函极值问题
平面内两点A,B,连接两点之间的曲线有很多种方式。分别用函数
f
i
(
x
)
f_{i}(x)
fi(x)来表示。对于给定的曲线
f
i
(
x
)
f_{i}(x)
fi(x), 那么两点之间连线的长度可以表示为
J
(
f
i
(
x
)
)
=
∫
A
B
1
+
f
i
′
(
x
)
2
d
x
J(f_{i}(x))=\int\limits_{A}^B\sqrt{1+f'_{i}(x)^2}dx
J(fi(x))=A∫B1+fi′(x)2dx
这里
J
J
J是函数
f
f
f的函数,又叫泛函。通过求
J
J
J的极值,求得对应的
f
(
x
)
f(x)
f(x),就是泛函的极值问题。求泛函极值问题常用的方法就是变分法。
变分法和欧拉-拉格朗日方程
考虑泛函(functional)常见形式
J
=
∫
x
1
x
2
F
(
x
,
y
(
x
)
,
y
′
(
x
)
)
d
x
J=\int\limits_{x_1}^{x_2} F(x,y(x),y'(x))dx
J=x1∫x2F(x,y(x),y′(x))dx
其中
- x 1 x_1 x1, x 2 x_2 x2是常数;
- y ( x ) y(x) y(x)二阶连续可微函数;
- y ′ ( x ) = d y / d x y'(x)=dy/dx y′(x)=dy/dx;
- F ( x , y ( x ) , y ′ ( x ) ) F(x,y(x),y'(x)) F(x,y(x),y′(x))是关于变量 x x x, y y y, y ′ y' y′的二阶连续可微函数。
假如泛函
J
[
y
]
J[y]
J[y]在
f
f
f处取得局部极小值,对于任意函数
η
(
x
)
\eta(x)
η(x), 有一阶导数且在
η
(
x
1
)
=
η
(
x
2
)
=
0
\eta(x_1)=\eta(x_2)=0
η(x1)=η(x2)=0, 对于趋近于0的任意小的数
ε
\varepsilon
ε,有:
J
[
f
]
≤
J
[
f
+
ε
η
]
J[f]\leq J[f+\varepsilon\eta]
J[f]≤J[f+εη]
其中,
ε
η
\varepsilon\eta
εη就是函数
f
f
f的变分,用
δ
f
\delta f
δf来表示。
用
f
+
ε
η
f+\varepsilon\eta
f+εη替换泛函
J
[
y
]
J[y]
J[y]中的
y
y
y,结果就是
ε
\varepsilon
ε的一个函数:
Φ
(
ε
)
=
J
[
f
+
ε
η
]
\Phi(\varepsilon)=J[f+\varepsilon\eta]
Φ(ε)=J[f+εη]
因为函数
J
J
J在
f
f
f处取得极小值,所以函数
Φ
(
ε
)
\Phi(\varepsilon)
Φ(ε)在
ε
=
0
\varepsilon=0
ε=0处取得极小值,因此,
Φ
′
(
0
)
≡
d
Φ
d
ε
∣
ε
=
0
=
∫
x
1
x
2
d
F
d
ε
∣
ε
=
0
d
x
=
0
\Phi'(0)\equiv\frac{d\Phi}{d\varepsilon}\bigg|_{\varepsilon=0}=\int_{x_1}^{x_2}\frac{dF}{d\varepsilon}\bigg|_{\varepsilon=0}dx=0
Φ′(0)≡dεdΦ∣∣∣∣ε=0=∫x1x2dεdF∣∣∣∣ε=0dx=0
对泛函
F
(
x
,
y
,
y
′
)
F(x,y,y')
F(x,y,y′)求全微分,其中
y
=
f
+
ε
y=f+\varepsilon
y=f+ε,
y
′
=
f
′
+
ε
η
′
y'=f'+\varepsilon\eta'
y′=f′+εη′都是
ε
\varepsilon
ε的函数,但是
x
x
x不是(即,
d
x
d
ε
=
0
\frac{dx}{d\varepsilon}=0
dεdx=0),所以有:
d
F
d
ε
=
∂
F
∂
y
d
y
d
ε
+
∂
F
∂
y
′
d
y
′
d
ε
\frac{dF}{d\varepsilon}=\frac{\partial{F}}{\partial{y}}\frac{dy}{d\varepsilon}+\frac{\partial{F}}{\partial{y'}}\frac{dy'}{d\varepsilon}
dεdF=∂y∂Fdεdy+∂y′∂Fdεdy′
因为
d
y
d
ε
=
η
\frac{dy}{d\varepsilon}=\eta
dεdy=η,
d
y
′
d
ε
=
η
′
\frac{dy'}{d\varepsilon}=\eta'
dεdy′=η′,所以有:
d
F
d
ε
=
∂
F
∂
y
η
+
∂
F
∂
y
′
η
′
\frac{dF}{d\varepsilon}=\frac{\partial{F}}{\partial{y}}\eta+\frac{\partial{F}}{\partial{y'}}\eta'
dεdF=∂y∂Fη+∂y′∂Fη′
因此
∫
x
1
x
2
d
F
d
ε
∣
ε
=
0
d
x
=
∫
x
1
x
2
(
∂
F
∂
f
η
+
∂
F
∂
f
′
η
′
)
d
x
=
∫
x
1
x
2
(
∂
F
∂
f
η
+
d
d
x
(
∂
F
∂
f
′
η
)
−
η
d
d
x
∂
F
∂
f
′
)
d
x
(
分
部
积
分
)
=
∫
x
1
x
2
(
∂
F
∂
f
η
−
η
d
d
x
∂
F
∂
f
′
)
d
x
+
∂
F
∂
f
′
η
∣
x
1
x
2
\begin{aligned} \int_{x_{1}}^{x_2}\frac{dF}{d\varepsilon}\bigg|_{\varepsilon=0}dx & =\int_{x_1}^{x_2}\bigg(\frac{\partial{F}}{\partial{f}}\eta+\frac{\partial{F}}{\partial{f'}}\eta'\bigg)dx \\ & =\int_{x_1}^{x_2}\bigg(\frac{\partial{F}}{\partial{f}}\eta+\frac{d}{dx}(\frac{\partial{F}}{\partial{f'}}\eta)-\eta\frac{d}{dx}\frac{\partial{F}}{\partial{f'}}\bigg)dx \quad(分部积分)\\ & = \int_{x_1}^{x_2}\bigg(\frac{\partial F}{\partial f}\eta-\eta\frac{d}{dx}\frac{\partial F}{\partial f'}\bigg)dx+\frac{\partial F}{\partial f'}\eta\bigg|_{x_1}^{x_2} \end{aligned}
∫x1x2dεdF∣∣∣∣ε=0dx=∫x1x2(∂f∂Fη+∂f′∂Fη′)dx=∫x1x2(∂f∂Fη+dxd(∂f′∂Fη)−ηdxd∂f′∂F)dx(分部积分)=∫x1x2(∂f∂Fη−ηdxd∂f′∂F)dx+∂f′∂Fη∣∣∣∣x1x2
当
ε
=
0
\varepsilon=0
ε=0时,
F
[
x
,
y
,
y
′
]
→
F
[
x
,
f
,
f
′
]
F[x,y,y']\to F[x,f,f']
F[x,y,y′]→F[x,f,f′]。因为
η
(
x
1
)
=
η
(
x
2
)
=
0
\eta(x_1)=\eta(x_2)=0
η(x1)=η(x2)=0,且公式左边等于0,所以有:
∫
x
1
x
2
η
(
x
)
(
∂
F
∂
f
−
d
d
x
∂
F
∂
f
′
)
d
x
=
0
\int_{x_1}^{x_2}\eta(x)\bigg(\frac{\partial F}{\partial f}-\frac{d}{dx}\frac{\partial F}{\partial f'}\bigg)dx=0
∫x1x2η(x)(∂f∂F−dxd∂f′∂F)dx=0
根据变分法基本定理,知道:
∂
F
∂
f
−
d
d
x
∂
F
∂
f
′
=
0
\frac{\partial F}{\partial f}-\frac{d}{dx}\frac{\partial F}{\partial f'}=0
∂f∂F−dxd∂f′∂F=0
这个公式即为欧拉-朗格朗日方程( Euler-Lagrange)。欧拉-拉格朗日方程还可以推广至多元和高阶,在偏微分方程和微分几何领域有广泛的应用前景。
变分法典型应用
最短距离问题
针对一开始提出的最短距离问题,其泛函表示形式为:
J
(
f
(
x
)
)
=
∫
A
B
1
+
f
′
(
x
)
2
d
x
J(f(x))=\int\limits_{A}^B\sqrt{1+f'(x)^2}dx
J(f(x))=A∫B1+f′(x)2dx
即
F
(
x
,
y
,
y
′
)
=
1
+
f
′
(
x
)
2
F(x,y,y')=\sqrt{1+f'(x)^2}
F(x,y,y′)=1+f′(x)2
∂
F
∂
f
=
0
\frac{\partial F}{\partial f}=0
∂f∂F=0
∂
F
∂
f
′
=
f
′
(
x
)
1
+
f
′
(
x
)
2
\frac{\partial F}{\partial f'}=\frac{f'(x)}{\sqrt{1+f'(x)^2}}
∂f′∂F=1+f′(x)2f′(x)
d
d
x
∂
F
∂
f
′
=
f
′
′
(
x
)
(
1
+
f
′
(
x
)
2
)
−
3
2
\frac{d}{dx}\frac{\partial F}{\partial f'}=f''(x)(1+f'(x)^2)^{-\frac{3}{2}}
dxd∂f′∂F=f′′(x)(1+f′(x)2)−23
根据欧拉公式,得:
f
′
′
(
x
)
=
0
f''(x)=0
f′′(x)=0
所以:
f
′
(
x
)
=
a
f'(x)=a
f′(x)=a
f
(
x
)
=
a
x
+
b
f(x)=ax+b
f(x)=ax+b
其中
a
,
b
a,b
a,b为与起始点相关的常数。即两点之间直线最短。