本篇文章适合个人复习翻阅,不建议新手入门使用
特征值
特征值的引入
定义:相似
若
A
,
B
A,B
A,B 均为
n
n
n 阶方阵且存在
n
n
n 阶非异阵
P
P
P,使得
B
=
P
−
1
A
P
B=P^{-1}AP
B=P−1AP则称
A
A
A 与
B
B
B 相似,记为
A
≈
B
A\approx B
A≈B
命题
相似关系是等价关系(满足自反性,对称性,传递性)
由不变子空间的相关结论,我们知道
定理
设线性空间
V
V
V 可分解为
V
=
V
1
⊕
V
2
⊕
⋯
⊕
V
m
V=V_1\oplus V_2\oplus\cdots\oplus V_m
V=V1⊕V2⊕⋯⊕Vm
其中每个 V i V_i Vi 都是线性变换 φ \varphi φ 的不变子空间,则 φ \varphi φ 可以表示为分块对角阵
证明思路
只需证
m
=
2
m=2
m=2 的情形,设
V
1
V_1
V1 的一组基
{
e
1
,
e
2
,
…
,
e
r
}
\{e_1,e_2,\dots,e_r\}
{e1,e2,…,er},将其扩充为
V
V
V 的一组基
{
e
1
,
e
2
,
…
,
e
r
,
e
r
+
1
,
…
,
e
n
}
\{e_1,e_2,\dots,e_r,e_{r+1},\dots,e_n\}
{e1,e2,…,er,er+1,…,en},则
{
e
r
+
1
,
…
,
e
n
}
\{e_{r+1},\dots,e_n\}
{er+1,…,en} 是
V
2
V_2
V2 的一组基
由于
φ
(
V
1
)
⊂
V
1
,
φ
(
V
2
)
⊂
V
2
\varphi(V_1)\subset V_1,\varphi(V_2)\subset V_2
φ(V1)⊂V1,φ(V2)⊂V2,则设
{
φ
(
e
1
)
=
a
11
e
1
+
a
12
e
2
+
⋯
+
a
1
r
e
r
φ
(
e
2
)
=
a
21
e
1
+
a
22
e
2
+
⋯
+
a
2
r
e
r
⋯
⋯
φ
(
e
r
)
=
a
r
1
e
1
+
a
r
2
e
2
+
⋯
+
a
r
r
e
r
\begin{cases} \varphi(e_1)=a_{11}e_1+a_{12}e_2+\cdots+a_{1r}e_r\\ \varphi(e_2)=a_{21}e_1+a_{22}e_2+\cdots+a_{2r}e_r\\ \cdots\quad\cdots\\ \varphi(e_r)=a_{r1}e_1+a_{r2}e_2+\cdots+a_{rr}e_r\\ \end{cases}
⎩
⎨
⎧φ(e1)=a11e1+a12e2+⋯+a1rerφ(e2)=a21e1+a22e2+⋯+a2rer⋯⋯φ(er)=ar1e1+ar2e2+⋯+arrer
{ φ ( e r + 1 ) = a r + 1 , r + 1 e r + 1 + ⋯ + a r + 1 , n e n φ ( e r + 2 ) = a r + 2 , r + 1 e r + 1 + ⋯ + a r + 2 , n e n ⋯ ⋯ φ ( e n ) = a n , r + 1 e r + 1 + ⋯ + a n n e n \begin{cases} \varphi(e_{r+1})=a_{r+1,r+1}e_{r+1}+\cdots+a_{r+1,n}e_n\\ \varphi(e_{r+2})=a_{r+2,r+1}e_{r+1}+\cdots+a_{r+2,n}e_n\\ \cdots\quad\cdots\\ \varphi(e_{n})=a_{n,r+1}e_{r+1}+\cdots+a_{nn}e_n\\ \end{cases} ⎩ ⎨ ⎧φ(er+1)=ar+1,r+1er+1+⋯+ar+1,nenφ(er+2)=ar+2,r+1er+1+⋯+ar+2,nen⋯⋯φ(en)=an,r+1er+1+⋯+annen
即在
φ
(
e
1
)
,
…
,
φ
(
e
r
)
\varphi(e_1),\dots,\varphi(e_r)
φ(e1),…,φ(er) 的表达式中
e
r
+
1
,
…
,
e
n
e_{r+1},\dots,e_n
er+1,…,en 前的系数均为零,
在
φ
(
e
r
+
1
)
,
…
,
φ
(
e
n
)
\varphi(e_{r+1}),\dots,\varphi(e_n)
φ(er+1),…,φ(en) 的表达式中
e
1
,
…
,
e
r
e_{1},\dots,e_r
e1,…,er 前的系数均为零,
则
φ
\varphi
φ 在基
{
e
1
,
e
2
,
…
,
e
r
,
e
r
+
1
,
…
,
e
n
}
\{e_1,e_2,\dots,e_r,e_{r+1},\dots,e_n\}
{e1,e2,…,er,er+1,…,en} 下的表示矩阵形如
(
a
11
⋯
a
r
1
0
⋯
0
⋮
⋮
⋮
⋮
a
1
r
⋯
a
r
r
0
⋯
0
0
⋯
0
a
r
+
1
,
r
+
1
⋯
a
n
,
r
+
1
⋮
⋮
⋮
⋮
0
⋯
0
a
r
+
1
,
n
⋯
a
n
n
)
\begin{pmatrix} a_{11}&\cdots&a_{r1}&0&\cdots&0\\ \vdots&&\vdots&\vdots&&\vdots\\ a_{1r}&\cdots&a_{rr}&0&\cdots&0\\ 0&\cdots&0&a_{r+1,r+1}&\cdots&a_{n,r+1}\\ \vdots&&\vdots&\vdots&&\vdots\\ 0&\cdots&0&a_{r+1,n}&\cdots&a_{nn}\\ \end{pmatrix}
a11⋮a1r0⋮0⋯⋯⋯⋯ar1⋮arr0⋮00⋮0ar+1,r+1⋮ar+1,n⋯⋯⋯⋯0⋮0an,r+1⋮ann
即为分块对角阵 ■ \blacksquare ■
若 V i V_i Vi 是一维子空间,则 φ \varphi φ 在 V i V_i Vi 上的作用相当于一个数乘,即存在 λ 0 ∈ K \lambda_0\in\mathbb{K} λ0∈K,使得 φ ( x ) = λ 0 x \varphi(x)=\lambda_0x φ(x)=λ0x
若所有 V i V_i Vi 都是一维子空间,则 φ \varphi φ 的表示矩阵可写为对角阵
考虑如下问题:给定线性空间 V V V 上的线性变换 φ \varphi φ,能否找到 V V V 的一组基,使线性变换 φ \varphi φ 在这组基下的表示矩阵为对角阵;
由于一个线性变换在不同基下的矩阵是相似的,故上面的问题即可理解为找到所有相似于对角阵的矩阵
特征值、特征向量、特征多项式
定义:线性变换的特征值、特征向量
设
φ
\varphi
φ 是数域
K
\mathbb{K}
K 上线性空间
V
V
V 上的线性变换,若
λ
0
∈
K
,
x
∈
V
\lambda_0\in\mathbb{K},x\in V
λ0∈K,x∈V 且
x
≠
0
x\neq 0
x=0,使
φ
(
x
)
=
λ
0
x
\varphi(x)=\lambda_0x
φ(x)=λ0x
则称 λ 0 \lambda_0 λ0 是线性变换 φ \varphi φ 的一个特征值,向量 x x x 称为 φ \varphi φ 关于特征值 λ 0 \lambda_0 λ0 的特征向量
定义:特征子空间
φ
\varphi
φ 关于特征值
λ
0
\lambda_0
λ0 的全体特征向量和零向量构成一个
V
V
V 的子空间,记为
V
λ
0
V_{\lambda_0}
Vλ0,称为
φ
\varphi
φ 的关于特征值
λ
0
\lambda_0
λ0 的特征子空间,显然
V
λ
0
V_{\lambda_0}
Vλ0 是
φ
\varphi
φ 的不变子空间
设 φ \varphi φ 在某组基下的表示矩阵为 A A A,向量 x x x 在这组基下可表示为一个列向量 α \alpha α,此时 φ ( x ) = λ 0 x \varphi(x)=\lambda_0x φ(x)=λ0x,等价于 A α = λ 0 α A\alpha=\lambda_0\alpha Aα=λ0α
或 ( λ 0 I n − A ) α = 0 (\lambda_0I_n-A)\alpha=0 (λ0In−A)α=0
定义:矩阵的特征值
设
A
A
A 是数域
K
\mathbb{K}
K 上的
n
n
n 阶方阵,若存在
λ
0
∈
K
\lambda_0\in\mathbb{K}
λ0∈K 及
n
n
n 维非零列向量
α
\alpha
α,使得
A
α
=
λ
0
α
A\alpha=\lambda_0\alpha
Aα=λ0α
则称 λ 0 \lambda_0 λ0 为矩阵 A A A 的一个特征值, α \alpha α 为 A A A 关于特征值 λ 0 \lambda_0 λ0 的特征向量。齐次方程组 ( λ 0 I − A ) x = 0 (\lambda_0I-A)x=0 (λ0I−A)x=0 的解空间 V λ 0 V_{\lambda_0} Vλ0 称为 A A A 关于特征值 λ 0 \lambda_0 λ0 的特征子空间
定义:特征多项式
设
A
A
A 是
n
n
n 阶方阵,称
∣
λ
I
n
−
A
∣
|\lambda I_n-A|
∣λIn−A∣ 为
A
A
A 的特征多项式
注:
- 矩阵 A A A 的特征值即为它特征多项式的根
- 称 ∣ λ I n − A ∣ |\lambda I_n-A| ∣λIn−A∣ 为线性变换 φ \varphi φ 的特征多项式,记为 ∣ λ I − φ ∣ |\lambda I-\varphi| ∣λI−φ∣
定理
若
B
B
B 与
A
A
A 相似,则
B
B
B 与
A
A
A 具有相同的特征多项式,从而具有相同的特征值(计重数)
证明思路
∣
λ
I
n
−
B
∣
=
∣
P
−
1
(
λ
I
n
−
A
)
P
∣
=
∣
P
−
1
∣
∣
λ
I
n
−
A
∣
∣
P
∣
=
∣
λ
I
n
−
A
∣
|\lambda I_n -B|=|P^{-1}(\lambda I_n-A)P|=|P^{-1}||\lambda I_n-A||P|=|\lambda I_n-A|
∣λIn−B∣=∣P−1(λIn−A)P∣=∣P−1∣∣λIn−A∣∣P∣=∣λIn−A∣
命题
任意复方阵相似于一个上三角阵
注:上三角阵的特征值即为对角线上的元素
证明思路:(数学归纳法)
设
A
α
1
=
λ
1
α
1
A\alpha_1=\lambda_1\alpha_1
Aα1=λ1α1,将
α
1
\alpha_1
α1 作为
C
n
\mathbb{C}_n
Cn 的基向量,扩展为一组基
{
α
1
,
…
,
α
n
}
\{\alpha_1,\dots,\alpha_n\}
{α1,…,αn},拼成矩阵
P
=
{
α
1
,
…
,
α
n
}
P=\{\alpha_1,\dots,\alpha_n\}
P={α1,…,αn},则
P
P
P 为非异阵,且
A
P
=
(
α
1
,
…
,
α
n
)
(
λ
1
∗
O
A
1
)
AP=(\alpha_1,\dots,\alpha_n)\begin{pmatrix} \lambda_1&*\\ O&A_1\\ \end{pmatrix}
AP=(α1,…,αn)(λ1O∗A1)
注意到上式即为 P − 1 A P = ( λ 1 ∗ O A 1 ) P^{-1}AP=\begin{pmatrix} \lambda_1&*\\ O&A_1\\ \end{pmatrix} P−1AP=(λ1O∗A1),由于 A 1 A_1 A1 是 n − 1 n-1 n−1 阶方阵,由归纳法可得
特殊矩阵的特征值
命题:矩阵多项式的特征值
设
n
n
n 阶矩阵
A
A
A 的全部特征值
λ
1
,
λ
2
,
…
,
λ
n
\lambda_1,\lambda_2,\dots,\lambda_n
λ1,λ2,…,λn,
f
(
x
)
f(x)
f(x) 是一个多项式,则
f
(
A
)
f(A)
f(A) 的全部特征值为
f
(
λ
1
)
,
f
(
λ
2
)
,
…
,
f
(
λ
n
)
f(\lambda_1),f(\lambda_2),\dots,f(\lambda_n)
f(λ1),f(λ2),…,f(λn)
证明
由于任意
n
n
n 阶矩阵均复相似于上三角矩阵,故设
P
−
1
A
P
=
(
λ
1
∗
⋯
∗
0
λ
2
⋯
∗
⋮
⋮
⋮
0
0
⋯
λ
n
)
P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix}
P−1AP=
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
结合上三角矩阵的四则运算性质,可得
P
−
1
f
(
A
)
P
=
f
(
P
−
1
A
P
)
=
(
f
(
λ
1
)
∗
⋯
∗
0
f
(
λ
2
)
⋯
∗
⋮
⋮
⋮
0
0
⋯
f
(
λ
n
)
)
P^{-1}f(A)P=f(P^{-1}AP)=\begin{pmatrix} f(\lambda_1)&*&\cdots&*\\ 0&f(\lambda_2)&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&f(\lambda_n)\\ \end{pmatrix}
P−1f(A)P=f(P−1AP)=
f(λ1)0⋮0∗f(λ2)⋮0⋯⋯⋯∗∗⋮f(λn)
则观察出 f ( A ) f(A) f(A) 的特征值为 f ( λ 1 ) , f ( λ 2 ) , … , f ( λ n ) f(\lambda_1),f(\lambda_2),\dots,f(\lambda_n) f(λ1),f(λ2),…,f(λn)
命题:逆矩阵的特征值
设
n
n
n 阶矩阵
A
A
A 可逆,且
A
A
A 的特征值为
λ
1
,
λ
2
,
…
,
λ
n
\lambda_1,\lambda_2,\dots,\lambda_n
λ1,λ2,…,λn,则
A
−
1
A^{-1}
A−1 的全部特征值为
λ
1
−
1
,
λ
2
−
1
,
…
,
λ
n
−
1
\lambda_1^{-1},\lambda_2^{-1},\dots,\lambda_n^{-1}
λ1−1,λ2−1,…,λn−1
证明:(思路同上)
由于任意
n
n
n 阶矩阵均复相似于上三角矩阵,故设
P
−
1
A
P
=
(
λ
1
∗
⋯
∗
0
λ
2
⋯
∗
⋮
⋮
⋮
0
0
⋯
λ
n
)
P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix}
P−1AP=
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
则有
A
=
P
(
λ
1
∗
⋯
∗
0
λ
2
⋯
∗
⋮
⋮
⋮
0
0
⋯
λ
n
)
P
−
1
A=P\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix}P^{-1}
A=P
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
P−1
则
A
−
1
=
P
(
λ
1
−
1
∗
⋯
∗
0
λ
2
−
1
⋯
∗
⋮
⋮
⋮
0
0
⋯
λ
n
−
1
)
P
−
1
A^{-1}=P\begin{pmatrix} \lambda_1^{-1}&*&\cdots&*\\ 0&\lambda_2^{-1}&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n^{-1}\\ \end{pmatrix}P^{-1}
A−1=P
λ1−10⋮0∗λ2−1⋮0⋯⋯⋯∗∗⋮λn−1
P−1
则观察出 A − 1 A^{-1} A−1 的特征值为 λ 1 − 1 , λ 2 − 1 , … , λ n − 1 \lambda_1^{-1},\lambda_2^{-1},\dots,\lambda_n^{-1} λ1−1,λ2−1,…,λn−1
命题:循环矩阵的特征值
设循环矩阵
A
=
(
a
1
a
2
a
3
⋯
a
n
a
n
a
1
a
2
⋯
a
n
−
1
a
n
−
1
a
n
a
1
⋯
a
n
−
2
⋮
⋮
⋮
⋮
a
2
a
3
a
4
⋯
a
1
)
A=\begin{pmatrix} a_1&a_2&a_3&\cdots&a_n\\ a_n&a_1&a_2&\cdots&a_{n-1}\\ a_{n-1}&a_n&a_1&\cdots&a_{n-2}\\ \vdots&\vdots&\vdots&&\vdots\\ a_2&a_3&a_4&\cdots&a_1\\ \end{pmatrix}
A=
a1anan−1⋮a2a2a1an⋮a3a3a2a1⋮a4⋯⋯⋯⋯anan−1an−2⋮a1
设
J
=
(
O
I
n
−
1
1
O
)
J=\begin{pmatrix} O&I_{n-1}\\ 1&O\\ \end{pmatrix}
J=(O1In−1O),
f
(
x
)
=
a
1
+
a
2
x
+
a
3
x
2
+
⋯
a
n
x
n
−
1
f(x)=a_1+a_2x+a_3x^2+\cdots a_nx^{n-1}
f(x)=a1+a2x+a3x2+⋯anxn−1,则
A
=
f
(
J
)
A=f(J)
A=f(J),又
∣
λ
I
n
−
J
∣
=
λ
n
−
1
|\lambda I_n-J|=\lambda^n-1
∣λIn−J∣=λn−1,则
J
J
J 的特征值为
ω
k
=
exp
(
2
k
π
i
n
)
,
0
≤
k
≤
n
−
1
\omega_k=\exp{(\frac{2k\pi i}{n})},0\leq k\leq n-1
ωk=exp(n2kπi),0≤k≤n−1
从而 A A A 的特征值为 f ( ω 0 ) , f ( ω 1 ) , … , f ( ω n − 1 ) f(\omega_0),f(\omega_1),\dots,f(\omega_{n-1}) f(ω0),f(ω1),…,f(ωn−1)
命题:幂零矩阵的特征值
n
n
n 阶矩阵
A
A
A 是幂零矩阵当且仅当
A
A
A 的特征值全为零
证明
幂零矩阵即存在
k
k
k,使得
A
k
=
0
A^k=0
Ak=0,则对任意
A
A
A 的特征值
λ
\lambda
λ,有
λ
k
=
0
\lambda^k=0
λk=0,即
λ
=
0
\lambda=0
λ=0
反过来,若 A A A 的特征值全为零,则存在可逆阵 P P P,使得 B = P − 1 A P B=P^{-1}AP B=P−1AP 是上三角阵且对角线元素均为零,则 A n = P B n P − 1 = 0 A^n=PB^nP^{-1}=0 An=PBnP−1=0
命题:伴随矩阵的特征值
设
n
n
n 阶矩阵
A
A
A 的全体特征值为
λ
1
,
λ
2
,
…
,
λ
n
\lambda_1,\lambda_2,\dots,\lambda_n
λ1,λ2,…,λn,则
A
∗
A^*
A∗ 的全体特征值为
∏
i
≠
1
λ
i
,
∏
i
≠
2
λ
i
,
…
,
∏
i
≠
n
λ
i
\prod\limits_{i\neq 1}\lambda_i,\prod\limits_{i\neq 2}\lambda_i,\dots,\prod\limits_{i\neq n}\lambda_i
i=1∏λi,i=2∏λi,…,i=n∏λi
证明
由于任意
n
n
n 阶矩阵均复相似于上三角矩阵,故设
P
−
1
A
P
=
(
λ
1
∗
⋯
∗
0
λ
2
⋯
∗
⋮
⋮
⋮
0
0
⋯
λ
n
)
P^{-1}AP=\begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n\\ \end{pmatrix}
P−1AP=
λ10⋮0∗λ2⋮0⋯⋯⋯∗∗⋮λn
由于上三角的伴随矩阵仍为上三角,则
P
−
1
A
∗
P
=
P
∗
A
∗
(
P
−
1
)
∗
=
(
P
−
1
A
P
)
∗
=
(
∏
i
≠
1
λ
i
∗
⋯
∗
0
∏
i
≠
2
λ
i
⋯
∗
⋮
⋮
⋮
0
0
⋯
∏
i
≠
n
λ
i
)
P^{-1}A^*P=P^*A^*(P^{-1})^*=(P^{-1}AP)^*=\begin{pmatrix} \prod\limits_{i\neq 1}\lambda_i&*&\cdots&*\\ 0&\prod\limits_{i\neq 2}\lambda_i&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\prod\limits_{i\neq n}\lambda_i\\ \end{pmatrix}
P−1A∗P=P∗A∗(P−1)∗=(P−1AP)∗=
i=1∏λi0⋮0∗i=2∏λi⋮0⋯⋯⋯∗∗⋮i=n∏λi
参考书:《高等代数学》谢启鸿 姚慕生 吴泉水 编著