前言
矩阵的特征分解是比较基础的知识了,但是应用却十分广泛,比如主成分分析、矩阵分解之类的。现在回顾一下矩阵特征值的相关知识。
特征值和特征向量
定义:对于n阶实方阵 A A A,如果存在非零向量 x x x使得 A x = λ x , λ ∈ R Ax=\lambda x,\lambda \in R Ax=λx,λ∈R,则称 λ \lambda λ是矩阵 A A A的一个特征值, x x x是 A A A的属于 λ \lambda λ的特征向量。
以上数学定义比较简单但是不够直观。从几何上更容易理解:矩阵乘法实际上是对向量的线性变换(也就是对向量旋转和伸缩),特征向量就是经过线性变换后方向不变的向量,特征值就是伸缩量。
求矩阵特征值
A
x
=
λ
x
(
λ
E
−
A
)
x
=
0
矩
阵
方
程
有
非
零
解
,
说
明
(
λ
E
−
A
)
是
奇
异
矩
阵
∣
λ
E
−
A
∣
=
0
Ax=\lambda x \\ (\lambda E- A) x = 0 \\ \quad \\ 矩阵方程有非零解,说明(\lambda E- A)是奇异矩阵\\ \quad \\ |\lambda E- A|=0
Ax=λx(λE−A)x=0矩阵方程有非零解,说明(λE−A)是奇异矩阵∣λE−A∣=0
∣
λ
E
−
A
∣
|\lambda E- A|
∣λE−A∣是矩阵
A
A
A的特征多项式,求解得到
A
A
A的所有特征值,然后将特征值带回
A
x
=
λ
x
Ax=\lambda x
Ax=λx得到对应的特征向量。
不同特征值的特征向量是线性无关的,证明如下:
A
x
1
=
λ
1
x
1
A
x
2
=
λ
2
x
2
如
果
x
1
,
x
2
线
性
相
关
,
则
存
在
非
全
零
k
1
,
k
2
使
得
k
1
x
1
+
k
2
x
2
=
0
x
1
=
−
k
2
x
2
/
k
1
−
A
k
2
x
2
/
k
1
=
−
λ
1
k
2
x
2
/
k
1
A
x
2
=
λ
1
x
2
这
样
x
2
就
是
λ
1
的
特
征
向
量
了
,
与
题
设
矛
盾
,
得
证
Ax_1=\lambda_1 x_1 \\ Ax_2=\lambda_2 x_2 \\ \quad \\ 如果x_1,x_2线性相关,则存在非全零k_1,k_2使得 \\ \quad \\ k_1x_1+k_2x_2 = 0 \\ x_1 = -k_2x_2/k_1 \\ -Ak_2x_2/k_1=-\lambda_1k_2x_2/k_1 \\ Ax_2=\lambda_1 x_2 \\ \quad \\ 这样x_2就是\lambda_1的特征向量了,与题设矛盾,得证
Ax1=λ1x1Ax2=λ2x2如果x1,x2线性相关,则存在非全零k1,k2使得k1x1+k2x2=0x1=−k2x2/k1−Ak2x2/k1=−λ1k2x2/k1Ax2=λ1x2这样x2就是λ1的特征向量了,与题设矛盾,得证
同一特征值的不同特征向量,可能相关也可能无关,取决于代入特征值后,齐次线性方程组对应矩阵的秩。
矩阵的特征分解
n阶矩阵A能够特征分解的充要条件是,A有n个线性无关的特征向量。
求出矩阵所有特征值和特征向量后:
A
x
1
=
λ
1
x
1
A
x
2
=
λ
2
x
2
A
x
3
=
λ
3
x
3
A
[
x
1
,
x
2
,
x
3
]
=
[
λ
1
x
1
,
λ
2
x
2
,
λ
3
x
3
]
=
[
x
1
,
x
2
,
x
3
]
d
i
a
g
[
λ
1
,
λ
2
,
λ
3
]
A
=
[
x
1
,
x
2
,
x
3
]
d
i
a
g
[
λ
1
,
λ
2
,
λ
3
]
[
x
1
,
x
2
,
x
3
]
−
1
A
=
X
Λ
X
−
1
Ax_1=\lambda_1 x_1 \\ Ax_2=\lambda_2 x_2 \\ Ax_3=\lambda_3 x_3 \\ A[x_1,x_2,x_3]=[\lambda_1 x_1, \lambda_2 x_2, \lambda_3 x_3] \\ = [x_1,x_2,x_3]diag[\lambda_1,\lambda_2, \lambda_3] \\ A = [x_1,x_2,x_3]diag[\lambda_1,\lambda_2, \lambda_3] [x_1,x_2,x_3]^{-1} \\ \quad \\ A=X\Lambda X^{-1}
Ax1=λ1x1Ax2=λ2x2Ax3=λ3x3A[x1,x2,x3]=[λ1x1,λ2x2,λ3x3]=[x1,x2,x3]diag[λ1,λ2,λ3]A=[x1,x2,x3]diag[λ1,λ2,λ3][x1,x2,x3]−1A=XΛX−1
以上就是特征分解的过程。
补充:实对称矩阵
如果元素全是实数并且 A = A T A=A^T A=AT,则A是实对称矩阵。
实对称矩阵具有几个有用的性质:
性质1.特征值和特征向量都是在实数域内。
性质2.不同特征值对应的特征向量正交。
性质3.n重特征值有n个线性无关的特征向量。
性质4.实对称矩阵一定能够特征分解。
后记
矩阵的特征值和特征向量给出了一种可能的将矩阵分解的方法:特征分解(矩阵对角化)。下一次将介绍矩阵的另一种特性:奇异值与奇异分解。