第六章,线性变换,2-线性变换的特征值与特征向量
玩转线性代数(33)线性变换的特征值与特征向量的笔记,相关证明以及例子见原文
特征值与特征向量定义
设A是n阶方阵,如果数
λ
\lambda
λ和n维非零列向量x满足关系式
A
x
=
λ
x
Ax = \lambda x
Ax=λx
则称
λ
\lambda
λ为A的特征值,x为A的属于
λ
\lambda
λ的一个特征向量
一般求法
一般地,由
A
x
=
λ
x
Ax = \lambda x
Ax=λx可得
(
A
−
λ
E
)
x
=
0
(1)
\tag*{(1)} (A-\lambda E)x=0
(A−λE)x=0(1)
(1)式有非零解的充要条件是
∣
A
−
λ
E
∣
=
0
(2)
\tag*{(2)} |A-\lambda E|=0
∣A−λE∣=0(2)
(2)为以
λ
\lambda
λ为未知数的一元n次方程,称为矩阵A的特征方程,左端的
f
(
λ
)
=
∣
A
−
λ
E
∣
f(\lambda)=|A-\lambda E|
f(λ)=∣A−λE∣称为A的特征多项式
由此得到求解特征值与特征向量的求法:
(1)解
∣
A
−
λ
E
∣
=
0
|A-\lambda E|=0
∣A−λE∣=0得特征值
λ
\lambda
λ;
(2)将所求
λ
\lambda
λ代入
∣
A
−
λ
E
∣
x
=
0
|A-\lambda E|x=0
∣A−λE∣x=0中,方程组的非零解即为
λ
\lambda
λ对应的特征向量。
特征子空间
矩阵A所有的特征向量合在一起不是向量空间,因特征向量不为零向量.
所以特征值对应的特征向量再加上零向量构成一个向量空间,称为特征子空间.
性质
已知A的特征值与特征向量分别是 λ \lambda λ和微量x,m次多项式 ϕ ( A ) = a 0 E + a 1 A + ⋯ + a m A m \phi(A)=a_0E+a_1A+\cdots+a_mA^m ϕ(A)=a0E+a1A+⋯+amAm的特征值为 ϕ ( λ ) = a 0 + a 1 λ + ⋯ + a m λ m \phi(\lambda)=a_0+a_1\lambda+\cdots+a_m\lambda^m ϕ(λ)=a0+a1λ+⋯+amλm,对应于 ϕ ( λ ) \phi(\lambda) ϕ(λ)的特征向量仍为x.
A − 1 、 A T 、 A ∗ A^{-1}、A^T、A^* A−1、AT、A∗的特征值和特征向量
A − 1 A^{-1} A−1
若A可逆,设 λ \lambda λ为A的特征值,x为 λ \lambda λ对应的特征向量,有 A x = λ x ⇒ A − 1 A X = A − 1 λ X ⇒ A − 1 X = x λ Ax=\lambda x \Rightarrow A^{-1}AX=A^{-1}\lambda X\Rightarrow A^{-1}X=\frac{x}{\lambda} Ax=λx⇒A−1AX=A−1λX⇒A−1X=λx,所以 A − 1 A^{-1} A−1的特征值为 1 λ \frac{1}{\lambda} λ1,特征向量不变
A T A^T AT
∣ A T − λ E ∣ = ∣ ( A − λ E ) T ∣ = ∣ A − λ E ∣ |A^T-\lambda E|=|(A-\lambda E)^T|=|A-\lambda E| ∣AT−λE∣=∣(A−λE)T∣=∣A−λE∣,故 A T A^T AT与A的特征多项式相同 ,从而 A T A^T AT与A的特征值相同,但其同一特征值对应的特征向量不一定相同,需求解 ( A T − λ E ) x = 0 (A^T-\lambda E)x=0 (AT−λE)x=0
A ∗ A^* A∗
如果A可逆,已知A的特征值
λ
\lambda
λ与特征向量x
A
x
=
λ
x
⇒
A
∗
A
x
=
A
∗
λ
x
⇒
∣
A
∣
x
=
A
∗
λ
x
⇒
A
∗
x
=
∣
A
∣
x
λ
Ax=\lambda x \Rightarrow A^*A x = A^*\lambda x \Rightarrow |A|x=A^*\lambda x \Rightarrow A^*x=\frac{|A|x}{\lambda}
Ax=λx⇒A∗Ax=A∗λx⇒∣A∣x=A∗λx⇒A∗x=λ∣A∣x,故
A
∗
A^*
A∗的特征值为
∣
A
∣
λ
\frac{|A|}{\lambda}
λ∣A∣,对应的特征向量x
幂等矩阵、幂零矩阵的特征值和特征向量
幂等矩阵
若n阶矩阵A满足
A
2
=
A
A^2=A
A2=A,称A为幂等矩阵,它的特征值为1或0:
证明:
A
2
X
=
λ
2
X
=
A
X
=
λ
X
⇒
(
λ
2
−
λ
)
X
=
0
⇒
λ
(
λ
−
1
)
=
0
⇒
λ
=
0
,
1
A^2X=\lambda^2X=AX=\lambda X \Rightarrow (\lambda^2-\lambda)X=0 \Rightarrow \lambda(\lambda-1)=0 \Rightarrow \lambda=0,1
A2X=λ2X=AX=λX⇒(λ2−λ)X=0⇒λ(λ−1)=0⇒λ=0,1
幂零矩阵
若n阶矩阵A存在一个k,使
A
k
=
0
A^k=0
Ak=0,称A为幂零矩阵,它的特征值均为0.
证明:
A
k
X
=
A
k
−
1
(
A
X
)
=
A
k
−
1
(
λ
X
)
=
λ
(
A
k
−
1
X
)
=
0
A^k X = A^{k-1} (AX) = A^{k-1} (λX) = λ(A^{k-1} X) = 0
AkX=Ak−1(AX)=Ak−1(λX)=λ(Ak−1X)=0,根据定义,
A
k
=
0
A^k = 0
Ak=0,因此
A
k
−
1
X
A^{k-1}X
Ak−1X 是一个零向量。
以此类推,我们可以得出 A k − 2 v = 0 , A k − 3 X = 0 A^{k-2} v = 0,A^{k-3}X = 0 Ak−2v=0,Ak−3X=0,依此类推,直到 A X = 0 A X = 0 AX=0。
所以,无论特征值 λ \lambda λ 是多少,它都会满足 A X = λ X = 0 X AX = \lambda X = 0X AX=λX=0X,即特征向量对应的特征值为 0。
综上所述,幂零矩阵的特征值总是 0,这是因为幂零矩阵的特征向量最终都会被逐步"消减"为零向量。
特征值的性质
性质1
∣
A
∣
=
λ
1
λ
2
.
.
.
λ
n
|A|=\lambda_1\lambda_2...\lambda_n
∣A∣=λ1λ2...λn
证明:由于在复数范围内有
∣
A
−
λ
E
∣
=
(
λ
1
−
λ
)
(
λ
2
−
λ
)
.
.
.
(
λ
n
−
λ
)
|A-\lambda E|=(\lambda_1 - \lambda)(\lambda_2-\lambda)...(\lambda_n - \lambda)
∣A−λE∣=(λ1−λ)(λ2−λ)...(λn−λ)
令
λ
=
0
\lambda = 0
λ=0得
∣
A
∣
=
λ
1
λ
2
.
.
.
λ
n
|A|=\lambda_1\lambda_2...\lambda_n
∣A∣=λ1λ2...λn
性质2
λ
1
+
λ
2
+
.
.
.
+
λ
n
=
a
11
+
a
22
+
.
.
.
+
a
n
n
\lambda_1+\lambda_2+...+\lambda_n = a_{11}+a_{22}+...+a_{nn}
λ1+λ2+...+λn=a11+a22+...+ann
证见原文
特征向量的性质
证见原文
定理1
设 λ 1 , λ 2 , . . . , λ s \lambda_1,\lambda_2,...,\lambda_s λ1,λ2,...,λs是方阵A的互异特征值, ξ 1 , ξ 2 , . . . , ξ s \xi_1,\xi_2,...,\xi_s ξ1,ξ2,...,ξs是分别属于它们的特征向量,那么 ξ 1 , ξ 2 , . . . , ξ s \xi_1,\xi_2,...,\xi_s ξ1,ξ2,...,ξs线性无关
定理2
同一特征值的特征向量的线性组合(组合系数不全为零)仍然为该特征值的特征向量
定理3
设 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2是A的两个 互异特征值, ξ 1 , ξ 2 , . . . , ξ s \xi_1,\xi_2,...,\xi_s ξ1,ξ2,...,ξs和 η 1 , η 2 , . . . , η t \eta_1,\eta_2,...,\eta_t η1,η2,...,ηt分别是属于 λ 1 , λ 2 \lambda_1,\lambda_2 λ1,λ2的特征向量,则 ξ 1 , ξ 2 , . . . , ξ s , η 1 , η 2 , . . . , η t \xi_1,\xi_2,...,\xi_s, \eta_1,\eta_2,...,\eta_t ξ1,ξ2,...,ξs,η1,η2,...,ηt线性无关