奇异值(Singular Values)是矩阵分解中的一个重要概念,特别是在**奇异值分解(SVD, Singular Value Decomposition)**中,它们用于描述矩阵的某些内在特性。奇异值可以看作是矩阵对向量进行线性变换时的“缩放因子”。
奇异值的定义:
给定一个
m
×
n
m \times n
m×n 的矩阵
A
A
A,通过奇异值分解,我们可以将矩阵
A
A
A 分解为:
A
=
U
Σ
V
T
A = U \Sigma V^T
A=UΣVT
其中:
- A A A 是要分解的矩阵。
- U U U 是一个 m × m m \times m m×m 的正交矩阵,称为左奇异向量。
- V V V 是一个 n × n n \times n n×n 的正交矩阵,称为右奇异向量。
- Σ \Sigma Σ 是一个 m × n m \times n m×n 的对角矩阵,对角线上的是矩阵 A A A 的奇异值,且奇异值按非递增顺序排列(从大到小)。
奇异值是矩阵 Σ \Sigma Σ 的对角线上的元素,记作 σ 1 , σ 2 , … , σ r \sigma_1, \sigma_2, \dots, \sigma_r σ1,σ2,…,σr,其中 r r r 是矩阵的秩。它们反映了矩阵在不同方向上的“伸缩”程度。
奇异值的性质:
-
非负实数:
奇异值始终是非负的实数,即 σ i ≥ 0 \sigma_i \geq 0 σi≥0。它们代表了矩阵的几何属性,比如向量在不同方向上的拉伸或压缩因子。 -
奇异值的数量:
对于一个 m × n m \times n m×n 的矩阵 A A A,奇异值的数量为 min ( m , n ) \min(m, n) min(m,n),即矩阵的最小维度决定了奇异值的数量。 -
秩:
矩阵的非零奇异值的数量等于矩阵的秩。如果矩阵 A A A 的秩是 r r r,那么有 r r r 个非零奇异值,其余的奇异值为 0。 -
与特征值的关系:
对于方阵(或一般矩阵),奇异值与矩阵的特征值相关。具体来说,奇异值是矩阵 A T A A^T A ATA 或 A A T A A^T AAT 的非零特征值的平方根:
σ i = λ i \sigma_i = \sqrt{\lambda_i} σi=λi其中 λ i \lambda_i λi 是 A T A A^T A ATA 或 A A T A A^T AAT 的特征值。
-
对矩阵的范数有直接影响:
- 矩阵的谱范数等于矩阵的最大奇异值。
- 矩阵的弗罗贝尼乌斯范数可以通过矩阵的所有奇异值来计算:
∥ A ∥ F = ∑ i = 1 r σ i 2 \|A\|_F = \sqrt{\sum_{i=1}^{r} \sigma_i^2} ∥A∥F=i=1∑rσi2
其中 ∥ A ∥ F \|A\|_F ∥A∥F 是矩阵 A A A 的弗罗贝尼乌斯范数, σ i \sigma_i σi 是奇异值。
举例说明:
假设我们有一个 2x2 的矩阵
A
A
A:
A
=
[
3
1
0
2
]
A = \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}
A=[3012]
-
计算 A T A A^T A ATA 或 A A T A A^T AAT:
我们可以计算 A T A A^T A ATA 或 A A T A A^T AAT,然后计算它们的特征值,最后对特征值开平方,得到矩阵的奇异值。
A T A = [ 3 1 0 2 ] T [ 3 1 0 2 ] = [ 9 3 3 5 ] A^T A = \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix}^T \begin{bmatrix} 3 & 1 \\ 0 & 2 \end{bmatrix} = \begin{bmatrix} 9 & 3 \\ 3 & 5 \end{bmatrix} ATA=[3012]T[3012]=[9335]计算 A T A A^T A ATA 的特征值,我们得到两个特征值 λ 1 \lambda_1 λ1 和 λ 2 \lambda_2 λ2。
-
奇异值是特征值的平方根:
通过开平方特征值,我们可以得到矩阵 A A A 的奇异值。假设我们计算出的特征值为 λ 1 = 10 \lambda_1 = 10 λ1=10, λ 2 = 4 \lambda_2 = 4 λ2=4,那么矩阵 A A A 的奇异值为:
σ 1 = 10 , σ 2 = 4 = 2 \sigma_1 = \sqrt{10}, \quad \sigma_2 = \sqrt{4} = 2 σ1=10,σ2=4=2
因此,矩阵 A A A 的奇异值为 10 \sqrt{10} 10 和 2。
奇异值的几何意义:
奇异值提供了关于矩阵如何将向量变换到新空间的信息。特别是,它们表示矩阵对不同方向上向量的缩放程度。奇异值为 1 表示该方向上的向量长度保持不变,奇异值大于 1 表示向量被拉伸,奇异值小于 1 表示向量被压缩。
奇异值的方向由奇异向量 U U U 和 V V V 决定:
- 左奇异向量(矩阵 U U U 的列向量)表示矩阵 A A A 在输出空间中的方向。
- 右奇异向量(矩阵 V V V 的列向量)表示矩阵 A A A 在输入空间中的方向。
奇异值的应用:
-
数据压缩:
奇异值分解常用于数据压缩技术,例如图像压缩。通过保留较大的奇异值并忽略较小的奇异值,可以在压缩数据的同时保留尽可能多的重要信息。 -
主成分分析(PCA):
PCA 是一种降维技术,背后依赖于奇异值分解。通过奇异值分解,可以找出数据集中最重要的方向(主成分),从而有效降低数据的维度。 -
矩阵求逆:
在求解伪逆矩阵时,奇异值分解是一种非常有效的工具。通过对奇异值取倒数,可以快速计算矩阵的伪逆。 -
信号处理:
奇异值分解在信号处理和噪声去除中有重要应用。通过识别和保留主要信号对应的奇异值,可以有效过滤噪声。
总结:
- 奇异值是矩阵通过奇异值分解得到的对角线上的非负数,表示矩阵对不同方向上的缩放比例。
- 奇异值可以通过对矩阵 A T A A^T A ATA 或 A A T A A^T AAT 的特征值开平方得到。
- 奇异值在许多应用中非常重要,如数据压缩、矩阵分解、主成分分析等。