最小作用量原理
最小作用量原理基本上是说我们这个宇宙总是选择某种“最经济”的方式运行,表现在物理规律上,就是有一个称为作用量的东西,正确的物理规律总是使得这个作用量取最小值。因此这个作用量必须是个标量。
向量和张量不能比较大小,除非先引入一个映射将其转换为标量。
此外,常(函)数作用量意义通常不大,因为常(函)数取最小值通常不能给出什么有用的信息。
考虑最简单的自由粒子的运动,唯一能想到的符合上述要求的量就是运动路径的长度,最多差一个常数因子,此时作用量就可以表示为
S
=
−
α
∫
a
b
d
s
S = -\alpha\int_a^bds
S=−α∫abds
这可能也是作用量用
S
S
S代表的一个原因。为了能使得
S
S
S有最小值,
α
\alpha
α必须为一个正数。
推广到高维情形时,我们可以定义作用量为
S
=
∫
L
d
x
μ
S = \int\mathscr L dx^\mu
S=∫Ldxμ
其中
L
\mathscr L
L称为拉格朗日密度,基本上就是高维的作用量"密度"的概念。
与度规适配的体元
上式仅在洛伦兹变换下才有意义,因为洛伦兹变换的行列式 ∣ Λ ∣ |\Lambda| ∣Λ∣为 1 1 1,因而 d x μ dx^\mu dxμ不会随参考系的变换改变。但在更一般的弯曲时空的情形,就需要考虑用 − g d x μ \sqrt{-g}dx^\mu −gdxμ来代替 d x μ dx^\mu dxμ,其中 g g g为度规的行列式。这个东西称为与度规适配的体元,是坐标变换下的不变量。
要看出这一点,只需注意到对于变换 x ↦ x ′ , d 4 x ′ = ∣ ∂ x ′ ∂ x ∣ d 4 x x \mapsto x', ~ d^4x' = |\frac{\partial x'}{\partial x}|d^4x x↦x′, d4x′=∣∂x∂x′∣d4x,这是多元微积分的换元规则。而 g μ ν ′ = ∂ x ρ ∂ x ′ μ ∂ x σ ∂ x ′ ν g ρ σ g'_{\mu\nu} = \frac{\partial x^\rho}{\partial x'^\mu}\frac{\partial x^\sigma}{\partial x'^\nu}g_{\rho\sigma} gμν′=∂x′μ∂xρ∂x′ν∂xσgρσ,两边取行列式就有 g ′ ( x ′ ) = ∣ ∂ x ′ ∂ x ∣ − 2 g ( x ) g'(x') = |\frac{\partial x'}{\partial x}|^{-2}g(x) g′(x′)=∣∂x∂x′∣−2g(x).
因此,我们的作用量现在就可以写为
S
=
∫
L
~
−
g
d
x
μ
=
∫
L
d
x
μ
S = \int\mathscr {\tilde L} \sqrt{-g}dx^\mu = \int\mathscr L dx^\mu
S=∫L~−gdxμ=∫Ldxμ
拉格朗日方程
一般的拉格朗日密度为广义坐标
q
i
(
t
)
q^i(t)
qi(t)及其时空导数的函数,但在场论的情形,
q
i
(
t
)
q^i(t)
qi(t)应该推广为场量
ϕ
(
x
,
t
)
\phi(x, t)
ϕ(x,t)。所以拉格朗日密度是场量及其时空导数的函数
L
=
L
(
ϕ
,
∂
a
ϕ
)
\mathscr L = \mathscr L(\phi, \partial_a\phi)
L=L(ϕ,∂aϕ)
最小作用量原理给出
0
=
δ
S
=
∫
δ
L
d
x
μ
=
∫
[
∂
L
∂
ϕ
δ
ϕ
+
∂
L
∂
(
∂
a
ϕ
)
δ
(
∂
a
ϕ
)
]
d
x
μ
=
∫
[
∂
L
∂
ϕ
δ
ϕ
+
∂
L
∂
(
∂
a
ϕ
)
∂
a
(
δ
ϕ
)
]
d
x
μ
=
∫
[
∂
L
∂
ϕ
δ
ϕ
+
∂
a
(
∂
L
∂
(
∂
a
ϕ
)
δ
ϕ
)
−
δ
ϕ
∂
a
∂
L
∂
(
∂
a
ϕ
)
]
d
x
μ
=
∫
∂
a
(
∂
L
∂
(
∂
a
ϕ
)
δ
ϕ
)
d
x
μ
+
∫
(
∂
L
∂
ϕ
−
∂
a
∂
L
∂
(
∂
a
ϕ
)
)
δ
ϕ
d
x
μ
\begin{aligned} 0 = \delta S &= \int \delta\mathscr L dx^\mu = \int [\frac{\partial \mathscr L}{\partial \phi}\delta\phi + \frac{\partial \mathscr L}{\partial (\partial_a\phi)}\delta(\partial_a\phi)]dx^\mu \\ & = \int [\frac{\partial \mathscr L}{\partial \phi}\delta\phi + \frac{\partial \mathscr L}{\partial (\partial_a\phi)}\partial_a(\delta\phi)]dx^\mu \\ & = \int [\frac{\partial \mathscr L}{\partial \phi}\delta\phi + \partial_a(\frac{\partial \mathscr L}{\partial (\partial_a\phi)}\delta\phi) - \delta\phi\partial_a\frac{\partial \mathscr L}{\partial (\partial_a\phi)}]dx^\mu \\ & = \int \partial_a(\frac{\partial \mathscr L}{\partial (\partial_a\phi)}\delta\phi)dx^\mu + \int (\frac{\partial \mathscr L}{\partial \phi} - \partial_a\frac{\partial \mathscr L}{\partial (\partial_a\phi)})\delta\phi dx^\mu \end{aligned}
0=δS=∫δLdxμ=∫[∂ϕ∂Lδϕ+∂(∂aϕ)∂Lδ(∂aϕ)]dxμ=∫[∂ϕ∂Lδϕ+∂(∂aϕ)∂L∂a(δϕ)]dxμ=∫[∂ϕ∂Lδϕ+∂a(∂(∂aϕ)∂Lδϕ)−δϕ∂a∂(∂aϕ)∂L]dxμ=∫∂a(∂(∂aϕ)∂Lδϕ)dxμ+∫(∂ϕ∂L−∂a∂(∂aϕ)∂L)δϕdxμ
根据高斯公式
∫
U
∂
a
(
∂
L
∂
(
∂
a
ϕ
)
δ
ϕ
)
=
∫
∂
U
∂
L
∂
(
∂
a
ϕ
)
δ
ϕ
\int_U \partial_a(\frac{\partial \mathscr L}{\partial (\partial_a\phi)}\delta\phi) = \int_{\partial U}\frac{\partial \mathscr L}{\partial (\partial_a\phi)}\delta\phi
∫U∂a(∂(∂aϕ)∂Lδϕ)=∫∂U∂(∂aϕ)∂Lδϕ
而在全时空
U
U
U的无限远边界
∂
U
\partial U
∂U上,我们要求
δ
ϕ
=
0
\delta\phi = 0
δϕ=0. 于是就有
∂
L
∂
ϕ
−
∂
a
∂
L
∂
(
∂
a
ϕ
)
=
0
\frac{\partial \mathscr L}{\partial \phi} - \partial_a\frac{\partial \mathscr L}{\partial (\partial_a\phi)} = 0
∂ϕ∂L−∂a∂(∂aϕ)∂L=0
这被称为拉格朗日方程。
诺特定理
本节推导需要读者了解李导数和Killing矢量场的性质。
如上所述,拉格朗日密度
L
\mathscr L
L是
ϕ
,
∂
a
ϕ
,
g
a
b
\phi, ~ \partial_a\phi, ~ g_{ab}
ϕ, ∂aϕ, gab三者的函数。考虑光滑矢量场
ξ
a
\xi^a
ξa生成的单参微分同胚族
f
λ
f_\lambda
fλ(其中
f
0
f_0
f0代表恒等映射),其诱导的拉回映射把
ϕ
,
∂
a
ϕ
,
g
a
b
\phi, ~ \partial_a\phi, ~ g_{ab}
ϕ, ∂aϕ, gab变为新场
ϕ
λ
≡
f
λ
∗
ϕ
,
(
∂
a
ϕ
)
λ
≡
f
λ
∗
(
∂
a
ϕ
)
,
(
g
a
b
)
λ
≡
f
λ
∗
g
a
b
\phi_\lambda \equiv f^*_\lambda\phi, ~ (\partial_a\phi)_\lambda \equiv f^*_\lambda(\partial_a\phi), ~ (g_{ab})_\lambda \equiv f^*_\lambda g_{ab}
ϕλ≡fλ∗ϕ, (∂aϕ)λ≡fλ∗(∂aϕ), (gab)λ≡fλ∗gab
相应的
L
\mathscr L
L就变为
L
λ
≡
L
(
ϕ
λ
,
(
∂
a
ϕ
)
λ
,
(
g
a
b
)
λ
)
\mathscr L_\lambda \equiv \mathscr L(\phi_\lambda, (\partial_a\phi)_\lambda, (g_{ab})_\lambda)
Lλ≡L(ϕλ,(∂aϕ)λ,(gab)λ)
且有
f
λ
∗
(
∂
a
ϕ
)
=
∂
a
′
(
f
λ
∗
ϕ
)
f^*_\lambda(\partial_a\phi) = \partial'_a(f^*_\lambda\phi)
fλ∗(∂aϕ)=∂a′(fλ∗ϕ)
其中
∂
a
′
\partial'_a
∂a′是与
(
g
a
b
)
λ
(g_{ab})_\lambda
(gab)λ适配的导数算符,即
∂
a
′
(
g
b
c
)
λ
=
0
\partial'_a(g_{bc})_\lambda = 0
∂a′(gbc)λ=0.
不难证明上述诸量的变分实际上对应的是其沿
ξ
a
\xi^a
ξa的李导数
L
ξ
L_\xi
Lξ,因为
δ
ϕ
=
d
ϕ
λ
d
λ
∣
λ
=
0
=
lim
λ
→
0
1
λ
(
f
λ
∗
ϕ
−
ϕ
)
=
L
ξ
ϕ
\delta\phi = \frac{d\phi_\lambda}{d\lambda}|_{\lambda = 0} = \lim_{\lambda \to 0}\frac{1}{\lambda}(f^*_\lambda\phi - \phi) = L_\xi\phi
δϕ=dλdϕλ∣λ=0=λ→0limλ1(fλ∗ϕ−ϕ)=Lξϕ
类似地
δ
(
∂
a
ϕ
)
=
L
ξ
(
∂
a
ϕ
)
,
δ
g
a
b
=
L
ξ
g
a
b
\delta(\partial_a\phi) = L_\xi(\partial_a\phi), ~ \delta g_{ab} = L_\xi g_{ab}
δ(∂aϕ)=Lξ(∂aϕ), δgab=Lξgab. 特别地,因为
L
\mathscr L
L是标量场,所以
δ
L
=
L
ξ
L
=
ξ
a
∂
a
L
\delta\mathscr L = L_\xi\mathscr L = \xi^a\partial_a\mathscr L
δL=LξL=ξa∂aL
而
δ
L
\delta \mathscr L
δL可以展开
δ
L
=
∂
L
∂
ϕ
L
ξ
ϕ
+
∂
L
∂
(
∂
a
ϕ
)
L
ξ
(
∂
a
ϕ
)
+
∂
L
∂
g
a
b
L
ξ
g
a
b
\delta \mathscr L = \frac{\partial \mathscr L}{\partial \phi}L_\xi\phi + \frac{\partial \mathscr L}{\partial (\partial_a\phi)}L_\xi(\partial_a\phi) + \frac{\partial \mathscr L}{\partial g_{ab}}L_\xi g_{ab}
δL=∂ϕ∂LLξϕ+∂(∂aϕ)∂LLξ(∂aϕ)+∂gab∂LLξgab
再将拉格朗日方程代入就得到
ξ
a
∂
a
L
=
(
∂
a
∂
L
∂
(
∂
a
ϕ
)
)
L
ξ
ϕ
+
∂
L
∂
(
∂
a
ϕ
)
L
ξ
(
∂
a
ϕ
)
+
∂
L
∂
g
a
b
L
ξ
g
a
b
\xi^a\partial_a\mathscr L = (\partial_a\frac{\partial \mathscr L}{\partial (\partial_a\phi)})L_\xi\phi + \frac{\partial \mathscr L}{\partial (\partial_a\phi)}L_\xi(\partial_a\phi) + \frac{\partial \mathscr L}{\partial g_{ab}}L_\xi g_{ab}
ξa∂aL=(∂a∂(∂aϕ)∂L)Lξϕ+∂(∂aϕ)∂LLξ(∂aϕ)+∂gab∂LLξgab
为考察对称性导致的守恒流,我们可令
ξ
a
\xi^a
ξa为Killing矢量场,此时就有
L
ξ
g
a
b
=
0
L_\xi g_{ab} = 0
Lξgab=0以及
(
g
b
c
)
λ
=
g
b
c
(g_{bc})_\lambda = g_{bc}
(gbc)λ=gbc,后者又导致
∂
a
′
=
∂
a
\partial'_a = \partial_a
∂a′=∂a,于是
L
ξ
(
∂
a
ϕ
)
=
lim
λ
→
0
[
f
λ
∗
(
∂
a
ϕ
)
−
∂
a
ϕ
]
=
lim
λ
→
0
[
∂
a
(
f
λ
∗
ϕ
)
−
∂
a
ϕ
]
=
∂
a
(
L
ξ
ϕ
)
L_\xi(\partial_a\phi) = \lim_{\lambda \to 0}[f^*_\lambda(\partial_a\phi) - \partial_a\phi] = \lim_{\lambda \to 0}[\partial_a(f^*_\lambda\phi) - \partial_a\phi] = \partial_a(L_\xi\phi)
Lξ(∂aϕ)=λ→0lim[fλ∗(∂aϕ)−∂aϕ]=λ→0lim[∂a(fλ∗ϕ)−∂aϕ]=∂a(Lξϕ)
前一个式子就简化为
ξ
a
∂
a
L
=
(
∂
a
∂
L
∂
(
∂
a
ϕ
)
)
L
ξ
ϕ
+
∂
L
∂
(
∂
a
ϕ
)
∂
a
(
L
ξ
ϕ
)
=
∂
a
(
∂
L
∂
(
∂
a
ϕ
)
L
ξ
ϕ
)
\xi^a\partial_a\mathscr L = (\partial_a\frac{\partial \mathscr L}{\partial (\partial_a\phi)})L_\xi\phi + \frac{\partial \mathscr L}{\partial (\partial_a\phi)}\partial_a(L_\xi\phi) = \partial_a(\frac{\partial \mathscr L}{\partial (\partial_a\phi)}L_\xi\phi)
ξa∂aL=(∂a∂(∂aϕ)∂L)Lξϕ+∂(∂aϕ)∂L∂a(Lξϕ)=∂a(∂(∂aϕ)∂LLξϕ)
注意到
∂
a
ξ
a
=
g
(
a
b
)
∂
[
a
ξ
b
]
=
0
\partial_a\xi^a = g^{(ab)}\partial_{[a}\xi_{b]} = 0
∂aξa=g(ab)∂[aξb]=0,就有
∂
a
(
ξ
a
L
)
=
∂
a
(
∂
L
∂
(
∂
a
ϕ
)
L
ξ
ϕ
)
\partial_a(\xi^a\mathscr L) = \partial_a(\frac{\partial \mathscr L}{\partial (\partial_a\phi)}L_\xi\phi)
∂a(ξaL)=∂a(∂(∂aϕ)∂LLξϕ)
于是矢量场
J
a
≡
∂
L
∂
(
∂
a
ϕ
)
L
ξ
ϕ
−
ξ
a
L
J^a \equiv \frac{\partial \mathscr L}{\partial (\partial_a\phi)}L_\xi\phi - \xi^a\mathscr L
Ja≡∂(∂aϕ)∂LLξϕ−ξaL
满足连续性方程
∂
a
J
a
=
0
\partial_aJ^a = 0
∂aJa=0,因而代表某种守恒流密度。
正则能动张量
定义
S
a
b
=
−
∂
L
∂
(
∂
a
ϕ
)
∂
b
ϕ
+
g
a
b
L
S^{ab} = -\frac{\partial \mathscr L}{\partial (\partial_a\phi)}\partial^b\phi + g^{ab}\mathscr L
Sab=−∂(∂aϕ)∂L∂bϕ+gabL,则
S
a
b
ξ
b
=
−
∂
L
∂
(
∂
a
ϕ
)
ξ
b
∂
b
ϕ
+
ξ
a
L
S^{ab}\xi_b = -\frac{\partial \mathscr L}{\partial (\partial_a\phi)}\xi_b\partial^b\phi + \xi^a\mathscr L
Sabξb=−∂(∂aϕ)∂Lξb∂bϕ+ξaL
当
ξ
a
\xi^a
ξa为时空平移,即
ξ
a
=
(
∂
∂
x
μ
)
a
\xi^a = (\frac{\partial}{\partial x^\mu})^a
ξa=(∂xμ∂)a时,因为
∂
a
ξ
b
=
0
\partial_a\xi^b = 0
∂aξb=0,不难证明
L
ξ
ϕ
=
ξ
a
∂
a
ϕ
L_\xi\phi = \xi^a\partial_a\phi
Lξϕ=ξa∂aϕ,所以
S
a
b
ξ
b
=
−
J
a
S^{ab}\xi_b = -J^a
Sabξb=−Ja
两边求导得
∂
a
S
a
b
ξ
b
=
−
∂
a
J
a
=
0
\partial_aS^{ab}\xi_b = -\partial_aJ^a = 0
∂aSabξb=−∂aJa=0,所以
∂
a
S
a
b
=
0
\partial_aS^{ab} = 0
∂aSab=0
因为时空平移对应的是能量和动量,
S
a
b
S^{ab}
Sab称为正则能动张量。
为了看出这一点,我们可以将对应的Killing矢量场代入
J
a
J^a
Ja的表达式。例如,当
ξ
a
=
(
∂
∂
t
)
a
\xi^a = (\frac{\partial}{\partial t})^a
ξa=(∂t∂)a时,取适配坐标系就有
J
a
≡
∂
L
∂
(
∂
a
ϕ
)
ϕ
˙
−
(
∂
∂
t
)
a
L
J^a \equiv \frac{\partial \mathscr L}{\partial (\partial_a\phi)}\dot\phi - (\frac{\partial}{\partial t})^a\mathscr L
Ja≡∂(∂aϕ)∂Lϕ˙−(∂t∂)aL
因此
J
0
=
∂
L
∂
ϕ
˙
ϕ
˙
−
L
J^0 = \frac{\partial \mathscr L}{\partial \dot\phi}\dot\phi - \mathscr L
J0=∂ϕ˙∂Lϕ˙−L
这正是系统的哈密顿密度。类似地,当
ξ
a
=
(
∂
∂
x
)
a
\xi^a = (\frac{\partial}{\partial x})^a
ξa=(∂x∂)a时,
J
a
≡
∂
L
∂
(
∂
a
ϕ
)
∂
ϕ
∂
x
−
(
∂
∂
x
)
a
L
J^a \equiv \frac{\partial \mathscr L}{\partial (\partial_a\phi)}\frac{\partial\phi}{\partial x} - (\frac{\partial}{\partial x})^a\mathscr L
Ja≡∂(∂aϕ)∂L∂x∂ϕ−(∂x∂)aL
因此
J
0
=
∂
L
∂
ϕ
˙
∂
ϕ
∂
x
J^0 = \frac{\partial \mathscr L}{\partial \dot\phi}\frac{\partial\phi}{\partial x}
J0=∂ϕ˙∂L∂x∂ϕ
注意
−
J
0
-J^0
−J0恰好就是系统的物理动量密度,其中
π
=
∂
L
∂
ϕ
˙
\pi = \frac{\partial \mathscr L}{\partial \dot\phi}
π=∂ϕ˙∂L称为共轭动量密度。
常见的作用量
自由粒子
根据狭义相对论,
d
s
2
=
−
(
c
2
−
v
2
)
d
t
2
ds^2 = -(c^2 - v^2)dt^2
ds2=−(c2−v2)dt2,因此自由粒子的作用量就可以写为
S
=
−
∫
t
1
t
2
α
c
1
−
v
2
c
2
d
t
S = -\int_{t_1}^{t_2}\alpha c\sqrt{1 - \frac{v^2}{c^2}}dt
S=−∫t1t2αc1−c2v2dt
为了得到
α
\alpha
α的表达式,考虑在
v
v
v远小于
c
c
c时有
1
2
m
v
2
=
L
=
−
α
c
1
−
v
2
c
2
\frac{1}{2}mv^2 = L = -\alpha c\sqrt{1 - \frac{v^2}{c^2}}
21mv2=L=−αc1−c2v2。把
L
L
L展开为
v
v
v的幂级数(得在
v
=
0
v = 0
v=0处展开到二阶导数,因为一阶导数为0)并略去高次项可得
L
=
−
α
c
+
α
v
2
2
c
L = -\alpha c + \frac{\alpha v^2}{2c}
L=−αc+2cαv2
其中
−
α
c
-\alpha c
−αc为常数,不影响运动方程,对比就可以发现
α
=
m
c
\alpha = mc
α=mc,因而作用量的最终表达式就是
S
=
−
∫
t
1
t
2
m
c
2
1
−
v
2
c
2
d
t
S = -\int_{t_1}^{t_2}mc^2\sqrt{1 - \frac{v^2}{c^2}}dt
S=−∫t1t2mc21−c2v2dt
相应的拉格朗日量是
L
=
−
m
c
2
1
−
v
2
c
2
L = -mc^2\sqrt{1 - \frac{v^2}{c^2}}
L=−mc21−c2v2. 拉格朗日方程是
d
d
t
∂
L
∂
v
=
0
\frac{d}{dt}\frac{\partial L}{\partial v} = 0
dtd∂v∂L=0
代入
L
L
L的表达式就得到运动方程
m
v
′
(
1
−
v
2
c
2
)
−
3
2
=
0
mv'(1 - \frac{v^2}{c^2})^{-\frac{3}{2}} = 0
mv′(1−c2v2)−23=0
与
f
=
m
a
γ
3
f = ma\gamma^3
f=maγ3对比,可以看出这就是粒子受力为零时的运动方程。
标量场
因为
L
=
L
(
ϕ
,
∂
a
ϕ
)
\mathscr L = \mathscr L(\phi, \partial_a\phi)
L=L(ϕ,∂aϕ),用
ϕ
\phi
ϕ和
∂
a
ϕ
\partial_a\phi
∂aϕ能构造出的最简单的标量有这样的形式
(
∂
a
ϕ
)
∂
a
ϕ
+
f
(
ϕ
)
(\partial^a\phi)\partial_a\phi + f(\phi)
(∂aϕ)∂aϕ+f(ϕ),其中
f
(
ϕ
)
f(\phi)
f(ϕ)是
ϕ
\phi
ϕ的任一函数。实际发现符合物理情况的
L
\mathscr L
L是
L
=
−
1
2
[
(
∂
a
ϕ
)
∂
a
ϕ
+
m
2
ϕ
2
]
\mathscr L = -\frac{1}{2}[(\partial^a\phi)\partial_a\phi + m^2\phi^2]
L=−21[(∂aϕ)∂aϕ+m2ϕ2]
代入拉格朗日方程给出
∂
a
∂
a
ϕ
−
m
2
ϕ
=
0
\partial_a\partial^a\phi - m^2\phi = 0
∂a∂aϕ−m2ϕ=0
这就是著名的Klein-Gordon方程。
Klein-Gordon方程是为了解决薛定谔方程的非协变性而导出,因薛定谔方程
i ℏ ∂ ∂ t Ψ = H Ψ = [ − ℏ 2 2 m ∇ 2 + V ( r ) ] Ψ i\hbar\frac{\partial}{\partial t}\Psi = H\Psi = [-\frac{\hbar^2}{2m}\nabla^2+ V(r)]\Psi iℏ∂t∂Ψ=HΨ=[−2mℏ2∇2+V(r)]Ψ
左边是对时间的一阶导数,而右边是对空间的二阶导数,时空坐标不平权。因此就考虑把方程左边也改成对时间的二阶导数,恰好我们有狭义相对论中的能量-动量关系 E 2 = m 2 c 4 + p 2 c 2 E^2 = m^2c^4 + p^2c^2 E2=m2c4+p2c2,算符化之后就是
− ℏ 2 ∂ 2 ∂ t 2 ϕ = − ℏ 2 ∇ 2 c 2 ϕ + m 2 c 4 ϕ -\hbar^2\frac{\partial^2}{\partial t^2}\phi = -\hbar^2\nabla^2c^2\phi + m^2c^4\phi −ℏ2∂t2∂2ϕ=−ℏ2∇2c2ϕ+m2c4ϕ
下面使用自然单位制 c = ℏ = 1 c = \hbar = 1 c=ℏ=1,上式就简化为
( − ∂ 2 ∂ t 2 + ∇ 2 ) ϕ − m 2 ϕ = 0 (-\frac{\partial^2}{\partial t^2} + \nabla^2)\phi - m^2\phi = 0 (−∂t2∂2+∇2)ϕ−m2ϕ=0
我们还可以取
ϕ
\phi
ϕ为复标量场,即令
ϕ
=
1
2
(
ϕ
1
+
i
ϕ
2
)
\phi = \frac{1}{\sqrt 2}(\phi_1 + i\phi_2)
ϕ=21(ϕ1+iϕ2)
其中
ϕ
1
,
ϕ
2
\phi_1, ~ \phi_2
ϕ1, ϕ2为两个实标量场,
ϕ
\phi
ϕ的拉格朗日密度为两者的对应拉格朗日密度之和,即
L
(
ϕ
,
∂
a
ϕ
;
ϕ
ˉ
,
∂
a
ϕ
ˉ
)
=
−
[
(
∂
a
ϕ
ˉ
)
∂
a
ϕ
+
m
2
ϕ
ϕ
ˉ
]
\mathscr L(\phi, \partial_a\phi; \bar\phi, \partial_a\bar\phi) = -[(\partial^a\bar\phi)\partial_a\phi + m^2\phi\bar\phi]
L(ϕ,∂aϕ;ϕˉ,∂aϕˉ)=−[(∂aϕˉ)∂aϕ+m2ϕϕˉ]
容易验证上述密度代入拉格朗日方程分别给出
ϕ
\phi
ϕ和
ϕ
ˉ
\bar\phi
ϕˉ的Klein-Gordon方程。
请注意如果我们取如下的变换
ϕ
′
=
e
−
i
q
θ
ϕ
,
ϕ
ˉ
′
=
e
i
q
θ
ϕ
ˉ
\phi' = e^{-iq\theta}\phi, ~ \bar\phi' = e^{iq\theta}\bar\phi
ϕ′=e−iqθϕ, ϕˉ′=eiqθϕˉ
则对应的拉格朗日密度是不变的,这被称为规范变换。
电磁场
电磁场的场量是电磁4势
A
ν
A_\nu
Aν,与标量场类似,其构造的标量有这样的形式
(
∂
μ
A
ν
)
∂
μ
A
ν
+
f
(
A
ν
)
(\partial^\mu A^\nu)\partial_\mu A_\nu + f(A_\nu)
(∂μAν)∂μAν+f(Aν),实际发现符合物理情况的
L
\mathscr L
L是
L
=
−
1
4
π
(
∂
[
μ
A
ν
]
)
∂
μ
A
ν
=
−
1
16
π
F
μ
ν
F
μ
ν
\mathscr L = -\frac{1}{4\pi}(\partial^{[\mu} A^{\nu]})\partial_\mu A_\nu = -\frac{1}{16\pi}F^{\mu\nu}F_{\mu\nu}
L=−4π1(∂[μAν])∂μAν=−16π1FμνFμν
其中
F
μ
ν
=
2
∂
[
μ
A
ν
]
F_{\mu\nu} = 2\partial_{[\mu} A_{\nu]}
Fμν=2∂[μAν],注意到
∂
L
∂
A
ν
=
0
\frac{\partial \mathscr L}{\partial A_\nu} = 0
∂Aν∂L=0和
∂
L
∂
(
∂
μ
A
ν
)
=
−
1
2
π
∂
[
μ
A
ν
]
=
−
1
4
π
F
μ
ν
\frac{\partial \mathscr L}{\partial (\partial_\mu A_\nu)} = -\frac{1}{2\pi}\partial^{[\mu} A^{\nu]} = -\frac{1}{4\pi}F^{\mu\nu}
∂(∂μAν)∂L=−2π1∂[μAν]=−4π1Fμν,就有
−
1
4
π
∂
μ
F
μ
ν
=
0
-\frac{1}{4\pi}\partial_\mu F^{\mu\nu} = 0
−4π1∂μFμν=0
这正是无源麦克斯韦方程。为了得到有源麦克斯韦方程,我们只需添加一项将
L
\mathscr L
L修改为
L
=
−
1
16
π
F
μ
ν
F
μ
ν
+
J
ν
A
ν
\mathscr L = -\frac{1}{16\pi}F^{\mu\nu}F_{\mu\nu} + J^\nu A_\nu
L=−16π1FμνFμν+JνAν
之后我们会知道,
J
ν
J^\nu
Jν实际上就是前述标量场的守恒流。
引力场
引力的场量为度规
g
a
b
g_{ab}
gab,仿照前面的讨论,我们考虑由
g
g
g的二阶导数组成的标量,最合适的人选莫过于黎曼曲率张量(缩并而得的标量)。实际上,能够给出爱因斯坦场方程的拉格朗日密度如下
L
=
−
g
R
\mathscr L = \sqrt{-g}R
L=−gR
其中
R
R
R为标量曲率,对应的作用量被称为爱因斯坦-希尔伯特作用量。拉格朗日方程在这里似乎不太好算,让我们直接计算作用量的变分,也就等价于计算
δ
L
=
R
δ
−
g
+
−
g
δ
R
=
R
δ
−
g
+
−
g
R
a
b
δ
g
a
b
+
−
g
g
a
b
δ
R
a
b
\delta\mathscr L = R\delta\sqrt{-g} + \sqrt{-g}\delta R = R\delta\sqrt{-g} + \sqrt{-g}R_{ab}\delta g^{ab} + \sqrt{-g}g^{ab}\delta R_{ab}
δL=Rδ−g+−gδR=Rδ−g+−gRabδgab+−ggabδRab. 我们一项一项来算,首先注意到
g
g
g是
g
a
b
g_{ab}
gab的行列式,也就是说
g
=
g
μ
ν
A
μ
ν
g = g_{\mu\nu}A^{\mu\nu}
g=gμνAμν,其中
A
μ
ν
A^{\mu\nu}
Aμν是
g
μ
ν
g_{\mu\nu}
gμν的代数余子式。而
A
μ
ν
g
=
(
g
μ
ν
)
−
1
=
g
μ
ν
\frac{A^{\mu\nu}}{g} = (g_{\mu\nu})^{-1} = g^{\mu\nu}
gAμν=(gμν)−1=gμν,所以
∂
g
∂
g
μ
ν
=
g
g
μ
ν
\frac{\partial g}{\partial g_{\mu\nu}} = gg^{\mu\nu}
∂gμν∂g=ggμν
而
δ
g
=
∂
g
∂
g
a
b
δ
g
a
b
=
g
g
a
b
δ
g
a
b
\delta g = \frac{\partial g}{\partial g_{ab}}\delta g_{ab} = gg^{ab}\delta g_{ab}
δg=∂gab∂gδgab=ggabδgab
由这些就不难得出
δ
−
g
=
1
2
−
g
g
a
b
δ
g
a
b
\delta\sqrt{-g} = \frac{1}{2}\sqrt{-g}g^{ab}\delta g_{ab}
δ−g=21−ggabδgab
然后我们想确认下
δ
g
a
b
\delta g_{ab}
δgab和
δ
g
a
b
\delta g^{ab}
δgab的关系,由
δ
a
b
=
g
a
c
g
c
b
\delta^a{}_b = g^{ac}g_{cb}
δab=gacgcb两边取变分可得
0
=
g
a
c
δ
g
c
b
+
g
c
b
δ
g
a
c
0 = g^{ac}\delta g_{cb} + g_{cb}\delta g^{ac}
0=gacδgcb+gcbδgac,再与
g
a
d
g_{ad}
gad缩并得
δ
g
d
b
=
−
g
a
d
g
c
b
δ
g
a
c
\delta g_{db} = -g_{ad}g_{cb}\delta g^{ac}
δgdb=−gadgcbδgac
换言之
δ
g
a
b
=
−
g
a
c
g
b
d
δ
g
c
d
\delta g^{ab} = -g^{ac}g^{bd}\delta g_{cd}
δgab=−gacgbdδgcd
代入
δ
L
\delta\mathscr L
δL整理一下就得到
δ
L
=
−
g
[
−
(
R
a
b
−
1
2
g
a
b
R
)
δ
g
a
b
+
g
a
b
δ
R
a
b
]
\delta\mathscr L = \sqrt{-g}[-(R^{ab} - \frac{1}{2}g^{ab}R)\delta g_{ab} + g^{ab}\delta R_{ab}]
δL=−g[−(Rab−21gabR)δgab+gabδRab]
接下来是计算
δ
R
a
b
\delta R_{ab}
δRab,回忆下
R
μ
ν
σ
ρ
=
Γ
ρ
μ
σ
,
ν
−
Γ
ρ
ν
σ
,
μ
+
Γ
λ
σ
μ
Γ
ρ
ν
λ
−
Γ
λ
σ
ν
Γ
ρ
μ
λ
R_{\mu\nu\sigma}{}^\rho = \Gamma^\rho{}_{\mu\sigma,\nu} - \Gamma^\rho{}_{\nu\sigma,\mu} + \Gamma^\lambda{}_{\sigma\mu}\Gamma^\rho{}_{\nu\lambda} - \Gamma^\lambda{}_{\sigma\nu}\Gamma^\rho{}_{\mu\lambda}
Rμνσρ=Γρμσ,ν−Γρνσ,μ+ΓλσμΓρνλ−ΓλσνΓρμλ
对上式变分给出
δ
R
μ
ν
σ
ρ
=
δ
Γ
ρ
μ
σ
,
ν
−
δ
Γ
ρ
ν
σ
,
μ
+
Γ
ρ
ν
λ
δ
Γ
λ
σ
μ
+
Γ
λ
σ
μ
δ
Γ
ρ
ν
λ
−
Γ
λ
σ
ν
δ
Γ
ρ
μ
λ
−
Γ
ρ
μ
λ
δ
Γ
λ
σ
ν
\delta R_{\mu\nu\sigma}{}^\rho = \delta\Gamma^\rho{}_{\mu\sigma,\nu} - \delta\Gamma^\rho{}_{\nu\sigma,\mu} + \Gamma^\rho{}_{\nu\lambda}\delta\Gamma^\lambda{}_{\sigma\mu} + \Gamma^\lambda{}_{\sigma\mu}\delta\Gamma^\rho{}_{\nu\lambda} - \Gamma^\lambda{}_{\sigma\nu}\delta\Gamma^\rho{}_{\mu\lambda} - \Gamma^\rho{}_{\mu\lambda}\delta\Gamma^\lambda{}_{\sigma\nu}
δRμνσρ=δΓρμσ,ν−δΓρνσ,μ+ΓρνλδΓλσμ+ΓλσμδΓρνλ−ΓλσνδΓρμλ−ΓρμλδΓλσν
注意到协变导数和偏导数的关系
δ
Γ
ρ
μ
σ
;
ν
=
δ
Γ
ρ
μ
σ
,
ν
+
Γ
ρ
ν
λ
δ
Γ
λ
μ
σ
−
Γ
λ
ν
μ
δ
Γ
ρ
λ
σ
−
Γ
λ
ν
σ
δ
Γ
ρ
μ
λ
\delta\Gamma^\rho{}_{\mu\sigma;\nu} = \delta\Gamma^\rho{}_{\mu\sigma,\nu} + \Gamma^\rho{}_{\nu\lambda} \delta\Gamma^\lambda{}_{\mu\sigma} - \Gamma^\lambda{}_{\nu\mu} \delta\Gamma^\rho{}_{\lambda\sigma} - \Gamma^\lambda{}_{\nu\sigma} \delta\Gamma^\rho{}_{\mu\lambda}
δΓρμσ;ν=δΓρμσ,ν+ΓρνλδΓλμσ−ΓλνμδΓρλσ−ΓλνσδΓρμλ
就容易验证
δ
R
μ
ν
σ
ρ
=
δ
Γ
ρ
μ
σ
;
ν
−
δ
Γ
ρ
ν
σ
;
μ
\delta R_{\mu\nu\sigma}{}^\rho = \delta\Gamma^\rho{}_{\mu\sigma;\nu} - \delta\Gamma^\rho{}_{\nu\sigma;\mu}
δRμνσρ=δΓρμσ;ν−δΓρνσ;μ
以下换回抽象指标,里奇张量的变分就简单地缩并得到
δ
R
a
b
=
δ
Γ
c
a
b
;
c
−
δ
Γ
c
c
b
;
a
\delta R_{ab}= \delta\Gamma^c{}_{ab;c} - \delta\Gamma^c{}_{cb;a}
δRab=δΓcab;c−δΓccb;a
注意到
∇
c
g
a
b
=
0
\nabla_cg^{ab} = 0
∇cgab=0,就有
g
a
b
δ
R
a
b
=
∇
c
(
g
a
b
δ
Γ
c
a
b
−
g
b
c
δ
Γ
d
d
b
)
g^{ab}\delta R_{ab} = \nabla_c(g^{ab}\delta\Gamma^c{}_{ab} - g^{bc}\delta\Gamma^d{}_{db})
gabδRab=∇c(gabδΓcab−gbcδΓddb)
是全微分项,在求积分得作用量时根据高斯定理其等于被微分项在无穷远边界处的积分,我们认为其为零。综上就有
0
=
δ
S
=
∫
δ
L
=
∫
−
(
R
a
b
−
1
2
g
a
b
R
)
−
g
δ
g
a
b
0 = \delta S = \int\delta\mathscr L = \int-(R^{ab} - \frac{1}{2}g^{ab}R)\sqrt{-g}\delta g_{ab}
0=δS=∫δL=∫−(Rab−21gabR)−gδgab
这就给出爱因斯坦场方程
R
a
b
−
1
2
g
a
b
R
=
0
R^{ab} - \frac{1}{2}g^{ab}R = 0
Rab−21gabR=0