特征值与特征向量基础
1. 特征值的定义
给定一个方阵
A
A
A,如果存在一个非零向量
v
v
v 和一个标量
λ
\lambda
λ,使得:
A
v
=
λ
v
A v = \lambda v
Av=λv
则称
λ
\lambda
λ 是矩阵
A
A
A 的特征值,而
v
v
v 是对应于特征值
λ
\lambda
λ 的特征向量。
1.1 几何意义
特征向量 v v v 表示矩阵 A A A 作用在向量 v v v 上时,虽然向量的长度可能会改变,但其方向保持不变。特征值 λ \lambda λ 表示的是该变化的缩放比例。
1.2 物理意义
在物理学、工程学等领域,特征值通常代表系统的固有性质。例如,在振动分析中,特征值可以表示系统的自然振动频率。
2. 如何求解特征值
求解矩阵 A A A 的特征值 λ \lambda λ 和特征向量 v v v 的步骤如下:
2.1 特征方程
从定义
A
v
=
λ
v
A v = \lambda v
Av=λv 出发,可以重写为:
(
A
−
λ
I
)
v
=
0
(A - \lambda I) v = 0
(A−λI)v=0
其中
I
I
I 是单位矩阵。为了有非零解
v
v
v,矩阵
A
−
λ
I
A - \lambda I
A−λI 必须是奇异的,即行列式为零:
det
(
A
−
λ
I
)
=
0
\det(A - \lambda I) = 0
det(A−λI)=0
这个行列式方程称为特征方程,它是关于
λ
\lambda
λ 的多项式,其解就是矩阵
A
A
A 的特征值。
2.2 计算步骤
- 写出矩阵 A A A 和单位矩阵 I I I,计算 A − λ I A - \lambda I A−λI。
- 求出 det ( A − λ I ) = 0 \det(A - \lambda I) = 0 det(A−λI)=0。
- 解出特征方程,得到特征值 λ \lambda λ。
- 将特征值代入 ( A − λ I ) v = 0 (A - \lambda I)v = 0 (A−λI)v=0,解出特征向量 v v v。
3. 例子
考虑一个简单的
2
×
2
2 \times 2
2×2 矩阵
A
A
A:
A
=
(
4
1
2
3
)
A = \begin{pmatrix} 4 & 1 \\ 2 & 3 \end{pmatrix}
A=(4213)
我们将求解其特征值和特征向量。
3.1 特征方程
根据特征方程:
det
(
A
−
λ
I
)
=
det
(
4
−
λ
1
2
3
−
λ
)
=
0
\det(A - \lambda I) = \det\begin{pmatrix} 4 - \lambda & 1 \\ 2 & 3 - \lambda \end{pmatrix} = 0
det(A−λI)=det(4−λ213−λ)=0
计算行列式:
(
4
−
λ
)
(
3
−
λ
)
−
2
×
1
=
λ
2
−
7
λ
+
10
=
0
(4 - \lambda)(3 - \lambda) - 2 \times 1 = \lambda^2 - 7\lambda + 10 = 0
(4−λ)(3−λ)−2×1=λ2−7λ+10=0
解这个方程:
λ
1
=
5
和
λ
2
=
2
\lambda_1 = 5 \quad \text{和} \quad \lambda_2 = 2
λ1=5和λ2=2
所以矩阵
A
A
A 的特征值是
λ
1
=
5
\lambda_1 = 5
λ1=5 和
λ
2
=
2
\lambda_2 = 2
λ2=2。
3.2 求解特征向量
对于 λ 1 = 5 \lambda_1 = 5 λ1=5:
我们解
(
A
−
5
I
)
v
=
0
(A - 5I)v = 0
(A−5I)v=0:
(
−
1
1
2
−
2
)
(
v
1
v
2
)
=
0
\begin{pmatrix} -1 & 1 \\ 2 & -2 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 0
(−121−2)(v1v2)=0
解得
v
1
=
v
2
v_1 = v_2
v1=v2,所以对应于特征值
λ
1
=
5
\lambda_1 = 5
λ1=5 的特征向量为:
v
1
=
(
1
1
)
v_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}
v1=(11)
对于 λ 2 = 2 \lambda_2 = 2 λ2=2:
我们解
(
A
−
2
I
)
v
=
0
(A - 2I)v = 0
(A−2I)v=0:
(
2
1
2
1
)
(
v
1
v
2
)
=
0
\begin{pmatrix} 2 & 1 \\ 2 & 1 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 0
(2211)(v1v2)=0
解得
v
1
=
−
v
2
v_1 = -v_2
v1=−v2,所以对应于特征值
λ
2
=
2
\lambda_2 = 2
λ2=2 的特征向量为:
v
2
=
(
−
1
1
)
v_2 = \begin{pmatrix} -1 \\ 1 \end{pmatrix}
v2=(−11)
3.3 总结
矩阵 A A A 的特征值是 5 和 2,特征向量分别是 ( 1 1 ) \begin{pmatrix} 1 \\ 1 \end{pmatrix} (11) 和 ( − 1 1 ) \begin{pmatrix} -1 \\ 1 \end{pmatrix} (−11)。
4. 特征值的几何解释
特征值与特征向量的几何意义在于,矩阵 A A A 对应于特征向量 v v v 的线性变换不会改变向量的方向,只是改变了向量的长度。特征值 λ \lambda λ 就是这种长度变化的比例因子。
在二维或三维空间中,这意味着某些方向上的向量在变换后保持方向不变,而仅在长度上发生缩放。
5. 特征值的实际应用
特征值和特征向量在许多科学和工程领域有广泛的应用,包括:
- 矩阵对角化:如果矩阵有足够的线性无关的特征向量,它可以被对角化,从而简化许多计算。
- 动态系统分析:特征值用于研究系统的稳定性。在物理系统中,特征值可以表示振动模式或自然频率。
- 数据压缩:在主成分分析(PCA)中,特征值用于降维,通过选择最大特征值对应的特征向量来保留数据的主要特征。
- 机器学习:特征值用于数据降维、聚类分析、图像处理等任务。