矩阵的特征值刻画矩阵的奇异性、反映矩阵所有对角元素的结构、刻画矩阵的正定性,是矩阵的固有属性。
特征问题与特征方程
矩阵的本质是对变换的描述。矩阵的特征值和特征向量刻画了变换的特性。
线性算子的特征值和特征向量
若非零向量 u u 作为线性算子的输入时,所产生的输入与输出相同,最多相差一个常数因子,即
则称向量 u u 是线性算子的特征向量,称标量 λ λ 为线性算子 L L 的特征值。
矩阵的特征值和特征向量
线性变换若可以表示为,则矩阵 A A 是线性变换的标准矩阵,相应地可以得到矩阵的特征值、特征向量 u u 应该满足
可知:
物理意义
矩阵 A A 对特征向量所作的线性变换不改变 u u 的方向,因此线性变换是保持方向的映射。
Hermitian矩阵(复共轭对称阵)的特征值
Hermitian矩阵的特征值一定是实数,且
其中, U=[u1,u2,...,un]T U = [ u 1 , u 2 , . . . , u n ] T , Σ=diag(λ1,...,λn) Σ = d i a g ( λ 1 , . . . , λ n )
特征值和特征向量的求解
- 求出使得矩阵 A−λI A − λ I 奇异(即行列式为0,矩阵不满秩)的 λ λ ,即为特征值。
- 根据 λ λ 的值,求所有满足 (A−λI)=0 ( A − λ I ) = 0 的非零向量 x x ,即为特征向量
特征多项式
定义矩阵A的特征多项式为 det(A−λI)=0 d e t ( A − λ I ) = 0 ,特征多项式的根即为矩阵 A A 的特征值。
定理
任何多项式都可以写成的矩阵的特征多项式。多项式
可以写成
p(λ)=det(λI−A)
p
(
λ
)
=
d
e
t
(
λ
I
−
A
)
,其中,
特征值与特征向量
特征值
特征值的一些相关术语:
(1)代数多重度(algebraic multiplicity):是指 λ λ 是特征方程的几重根。
(2)单特征值(simple eigenvalue):是指代数多重度为1.
(3)几何多重度(geometric multiplicity):是指与 λ λ 对应的线性无关的特征向量的个数。也就是特征空间 Null(A−λI) N u l l ( A − λ I ) 的维数。注意,一个特征值可能对应多个线性无关的特征向量。
(4)减次矩阵(derogatory matrix):是指至少有一个特征值的几何多重度大于1.
(5)半单特征值(semi-simple eigenvalue):代数多重度等于几何多重度。
性质
性质1 矩阵奇异,等价于至少有一个特征值等于0。
这是因为对奇异矩阵,有 Au=0 A u = 0 存在非零解。
性质2 矩阵与其转置矩阵的特征值相同。
易得。
性质3 λ λ 是 n×n n × n 矩阵 A A 的特征值。
- 矩阵的幂的特征值等于特征值的幂,即是 Ak A k 的特征值;
- A+σ2I A + σ 2 I 的特征值等于 λ+σ2 λ + σ 2
- 若A非奇异,则 A−1 A − 1 有特征值 1λ 1 λ
特征向量
左特征向量
Av=λv A v = λ v
右特征向量
uHA=λuH u H A = λ u H
Hermitian矩阵左右特征向量相同。
特征值分解只适用于正方阵。
定理
矩阵 A A 的不同特征值对应的特征向量之间是线性无关的。
矩阵的条件数
任何一个矩阵A的单个特征值的条件数是
即左右特征向量的余弦的倒数。
矩阵的行列式、矩阵的迹与特征值的关系
(1)矩阵的迹等于所有特征值之和
(2)矩阵的行列式等于矩阵所有特征值的乘积
矩阵多项式的特征值
A的n次多项式
的特征值是
f(λ)=λn+c1λn−1+...+cn−1λ+cn f ( λ ) = λ n + c 1 λ n − 1 + . . . + c n − 1 λ + c n
特征值和特征向量的性质总结
n×n n × n 的矩阵一共有 n n 个特征值,多重特征值按照多重度计入。
非对称实矩阵存在复的特征值或者复的特征向量,必定以复共轭对的形式出现
复共轭对称阵(Hermitian matrix)的所有特征值都是实数。
关于对角矩阵和三角矩阵的特征值:
(1)对角阵的特征值为对角元素;
(2)三角阵的对角元素是其所有特征值;
共轭对称
(1)转置:矩阵A的特征值是, 则 λ λ 是其转置矩阵的特征值
(2)共轭:矩阵A的特征值是 λ λ , 则 λ∗ λ ∗ 是其共轭矩阵的特征值
(3) A+σ2I A + σ 2 I 的特征值等于 λ+σ2 λ + σ 2
(4)逆矩阵:若A非奇异,则 A−1 A − 1 有特征值 1λ 1 λ
幂等矩阵
幂等矩阵 A2=A A 2 = A 的所有特征值取值为0或者1
实正交矩阵
所有特征值位于单位圆上
特征值与奇异性
奇异矩阵⇔至少有一个特征值为0 奇 异 矩 阵 ⇔ 至 少 有 一 个 特 征 值 为 0特征值与矩阵的迹
特征值求和等于矩阵的迹
特征值与行列式
特征值乘积等于行列式
矩阵 A A 的不同特征值对应的特征向量之间是线性无关的。
Hermitian矩阵的正定性
特征值与矩阵的秩
(1) n×n n × n 的矩阵有 r r 个非零特征值,则其秩至少为
(2)若0是 n×n n × n 矩阵A的无多重特征值,则 rank(A)=n−1 r a n k ( A ) = n − 1
(3)若
rank(A−λI)≤n−1 r a n k ( A − λ I ) ≤ n − 1则 λ λ 是矩阵 A A 的特征值。
这是因为奇异,所以 (A−λI)u=0 ( A − λ I ) u = 0 存在非零解,所以 λ λ 是特征值。
多重度
n×n n × n 的矩阵的任意特征值的几何多重度不可能大于代数多重度。
乘积的特征值
关于 m×n(n≥m) m × n ( n ≥ m ) 矩阵 A A 与矩阵 B B 乘积的特征值:
(1)若是矩阵乘积 AB A B 的特征值,则其也是 BA B A 的特征值
(2)若 λ≠0 λ ≠ 0 是矩阵乘积 BA B A 的特征值,则其也是 AB A B 的特征值
(3)若 λ1,λ2,...,λm λ 1 , λ 2 , . . . , λ m 是矩阵乘积 AB A B 的特征值,则 BA B A 的n个特征值为
λ1,λ2,...,λm,0,...,0 λ 1 , λ 2 , . . . , λ m , 0 , . . . , 0多项式的特征值
如前述
矩阵的指数函数的特征值
矩阵特征值与特征向量对的性质
若
n×n
n
×
n
矩阵
A
A
有个线性无关的特征向量,则
A
A
的特征值分解为
矩阵奇异值与特征值的关系
矩阵 Am×n A m × n 的非零奇异值等于 AAT A A T 或者 ATA A T A 的非零特征值的正平方根,且对应的左奇异向量与右奇异向量分别是矩阵 AAT A A T 与 ATA A T A 对应的特征向量。
矩阵的可对角化定理
注意,即使 A A 有多重根,它仍然可能是可以对角化的。因为它的n个特征向量可能是线性无关的。
广义特征值分解
对于非正方阵,仍然可以求特征值。考虑两个矩阵组成的矩阵对的特征值分解。
广义特征值分解
参考文献
《矩阵分析与应用》,张贤达