这一节我们来介绍特征值和特征向量的应用
矩阵的相似对角化
当矩阵有
n
n
n 个线性无关的特征向量时,矩阵可以相似对角化,即
A
=
S
Λ
S
−
1
(
1
)
\bm{A}=\bm{S}\Lambda \bm{S}^{-1}~~~~(1)
A=SΛS−1 (1)
其中 S \bm{S} S 是 n n n 个线性无关的特征向量作为列组成的矩阵. 注意,有没有 n n n 个线性无关的特征向量和矩阵可不可逆没有直接关系,因此可逆矩阵不一定可以相似对角化。
之所以叫相似对角化,是因为我们称 "
A
\bm{A}
A 和
B
\bm{B}
B 相似" 如果存在
P
\bm{P}
P 使得
A
=
P
B
P
−
1
\bm{A=PB}\bm{P}^{-1}
A=PBP−1
其中 P \bm{P} P 可以是任意可逆矩阵。此时 A \bm{A} A 和 B \bm{B} B 有同样的特征值。相似矩阵有相同的特征值
Reasoning: 我们来看一下 (1) 式为什么成立. 其实只要展开
A
S
=
A
[
v
1
,
v
2
,
.
.
.
,
v
n
]
=
[
λ
1
v
1
,
λ
2
v
2
,
.
.
.
,
λ
n
v
n
]
=
[
v
1
,
v
2
,
.
.
.
,
v
n
]
Λ
(
λ
1
,
λ
2
,
.
.
.
,
λ
n
)
=
S
Λ
\bm{AS} = A [\bm{v_1,v_2,...,v_n}]=[\lambda_1\bm{v_1},\lambda_2\bm{v_2},...,\lambda_n\bm{v_n}]=[\bm{v_1,v_2,...,v_n}] \Lambda(\lambda_1,\lambda_2,...,\lambda_n)=\bm{S\Lambda}
AS=A[v1,v2,...,vn]=[λ1v1,λ2v2,...,λnvn]=[v1,v2,...,vn]Λ(λ1,λ2,...,λn)=SΛ
答案就很显然了。注意,到这一步任意的 n n n 个特征向量都是成立的,但是要写成(1)的形式的一个必须条件是, S \bm{S} S 可逆,即它由 n n n 个线性无关的特征向量组成。
矩阵的幂
如果方阵
A
\bm{A}
A 可以相似对角化,我们可以得到
A
k
=
(
S
Λ
S
−
1
)
k
=
S
Λ
k
S
−
1
\bm{A^k}=(\bm{S}\Lambda \bm{S}^{-1})^k=\bm{S}\Lambda^k \bm{S}^{-1}
Ak=(SΛS−1)k=SΛkS−1
Theorem: 如果
A
\bm{A}
A 的所有特征值的绝对值
∣
λ
i
∣
<
1
|\lambda_i|<1
∣λi∣<1, 则
A
k
→
0
as
k
→
∞
\bm{A}^k\to 0~~\text{as}~~k\to \infty
Ak→0 as k→∞
如下图所示,如果居镇素有的特征值都在复平面的单位圆内 (不包括边界),
A
k
→
0
\bm{A}^k\to0
Ak→0 as
k
→
∞
k\to\infty
k→∞.
Fact 1: 不同特征值对应的特征向量线性无关。
所以有 n n n 个不同特征值的矩阵是可相似对角化的
解差分方程
Problem: 解 difference equation
u
k
+
1
=
A
u
k
\bm{u_{k+1}=Au_k}
uk+1=Auk
初始条件是 u 0 \bm{u_0} u0.
Solution: 把初始条件
u
0
\bm{u_0}
u0 表示为
A
\bm{A}
A 的特征向量的线性组合
u
0
=
c
1
v
1
+
c
2
v
2
+
.
.
.
+
c
n
v
n
=
S
c
\bm{u_0}=c_1\bm{v_1}+c_2\bm{v_2}+...+c_n\bm{v_n}=\bm{Sc}
u0=c1v1+c2v2+...+cnvn=Sc
这里 implicitly 指明这 n n n 个特征向量线性无关,不然没法span到整个空间来表示任意的 u 0 \bm{u_0} u0.
这个思路只要有了,下面就很简单了。我们有
u
k
=
A
k
u
0
=
c
1
λ
1
k
v
1
+
c
2
λ
2
k
v
2
+
.
.
.
+
c
n
λ
n
k
v
n
\bm{u}_k=\bm{A}^k\bm{u_0}=c_1\lambda_1^k\bm{v_1}+c_2\lambda_2^k\bm{v_2}+...+c_n\lambda_n^k\bm{v_n}
uk=Aku0=c1λ1kv1+c2λ2kv2+...+cnλnkvn
= Λ k S c =\Lambda^k\bm{Sc} =ΛkSc
例1 求解斐波那契数列第 100 个元素: F 0 = 0 F_0=0 F0=0, F 1 = 1 F_1=1 F1=1, F 2 = 1 F_2=1 F2=1, F 3 = 2 F_3=2 F3=2, F 4 = 3 F_4=3 F4=3, … . 通项为 F k + 2 = F k + 1 + F k F_{k+2}=F_{k+1}+F_{k} Fk+2=Fk+1+Fk.
令
u
k
=
[
F
k
+
1
,
F
k
]
⊤
u_k=[F_{k+1},F_k]^\top
uk=[Fk+1,Fk]⊤, 我们有
u
k
+
1
=
[
F
k
+
2
F
k
+
1
]
=
[
1
1
1
0
]
[
F
k
+
1
F
k
]
=
[
1
1
1
0
]
u
k
u_{k+1}=\begin{bmatrix} F_{k+2} \\ F_{k+1} \\ \end{bmatrix}=\begin{bmatrix} 1 & 1 \\ 1 & 0 \\ \end{bmatrix} \begin{bmatrix} F_{k+1} \\ F_{k} \\ \end{bmatrix}=\begin{bmatrix} 1 & 1 \\ 1 & 0 \\ \end{bmatrix}u_k
uk+1=[Fk+2Fk+1]=[1110][Fk+1Fk]=[1110]uk
令
A
=
[
1
1
1
0
]
\bm{A} = \begin{bmatrix} 1 & 1 \\ 1 & 0 \\ \end{bmatrix}
A=[1110]
它的特征行列式为
λ
2
−
λ
−
1
=
0
\lambda^2-\lambda-1 = 0
λ2−λ−1=0,
λ
1
=
1
+
5
2
,
v
1
=
[
λ
1
,
1
]
⊤
\lambda_1=\frac{1+\sqrt{5}}{2},~~~~\bm{v_1}=[\lambda_1,1]^\top
λ1=21+5, v1=[λ1,1]⊤
λ 2 = 1 − 5 2 , v 2 = [ λ 2 , 1 ] ⊤ \lambda_2=\frac{1-\sqrt{5}}{2},~~~~\bm{v_2}=[\lambda_2,1]^\top λ2=21−5, v2=[λ2,1]⊤
因为
∣
λ
2
∣
<
1
|\lambda_2|<1
∣λ2∣<1, 所以最后其实我们可以得到
F
100
≈
c
1
λ
1
k
v
1
+
c
2
λ
2
k
v
2
≈
c
1
λ
1
k
v
1
F_{100}\approx c_1\lambda_1^k\bm{v_1}+c_2\lambda_2^k\bm{v_2} \approx c_1\lambda_1^k\bm{v_1}
F100≈c1λ1kv1+c2λ2kv2≈c1λ1kv1
斐波那契数列大概是以 λ 1 \lambda_1 λ1 的速度在增长的。