A X = b AX=b AX=b
x是n维向量,b是m维向量,表明矩阵A可以将一个n维向量线性变换为另一个m维向量。
这样的线性变换可以为,旋转、投影、缩放三种类型的效
应。
奇异值分解
引入
A singular value decomposition provides a convenient way for breaking a matrix,
A
=
μ
∑
σ
T
A=\mu\sum\sigma^T
A=μ∑σT
μ
\mu
μ是一组正交基,
σ
\sigma
σ也是一组正交基,奇异值分解的意义就在于,将一个向量从以
σ
\sigma
σ为基旋转到以
μ
\mu
μ为基的向量空间里,且还进行一定缩放,表现在对角矩阵
∑
\sum
∑,缩放因子就是各个奇异值
如果
μ
\mu
μ的维度小于
σ
\sigma
σ的维度,则还进行了一定的投影。
奇异值分解的几何意义
对于一个矩阵,找到一组两两正交的单位向量,使矩阵作用在它身上经过线性变换后依然保持两两正交。而奇异值则是其长度发生的变化。
v
1
⊥
v
2
v_1\perp v_2
v1⊥v2
M
v
1
⊥
M
v
2
Mv_1 \perp Mv_2
Mv1⊥Mv2
∣
M
v
1
∣
=
∣
σ
1
v
1
∣
|Mv_1|=|\sigma_1v_1|
∣Mv1∣=∣σ1v1∣
A
=
[
3
0
0
1
]
A=\left[ \begin{matrix} 3&0 \\ 0&1 \\ \end{matrix} \right]
A=[3001]
任意向量以
v
1
,
v
2
v_1,v_2
v1,v2为基的
[
ϵ
1
,
ϵ
2
]
[\epsilon_1,\epsilon_2]
[ϵ1,ϵ2]经过矩阵A的线性变换后变成以
u
1
,
u
2
u_1,u_2
u1,u2为基的坐标为
[
3
ϵ
1
,
ϵ
2
]
=
[
η
1
,
η
2
]
[3\epsilon_1,\epsilon_2]=[\eta_1,\eta_2]
[3ϵ1,ϵ2]=[η1,η2]的向量。
如果
ϵ
1
2
+
ϵ
2
2
=
1
,
\epsilon_1^2+\epsilon_2^2=1,
ϵ12+ϵ22=1,则
η
1
2
9
+
η
2
2
=
1
\frac{\eta_1^2}{9}+\eta_2^2=1
9η12+η22=1,即该矩阵将任意一个向量球变成了一个椭圆球。
注:任意在
v
1
,
v
2
v_1,v_2
v1,v2基下的向量x. 可被表示成
[
v
1
,
v
2
]
∗
[
x
1
,
x
2
]
T
[v_1,v_2]*[x_1,x_2]^T
[v1,v2]∗[x1,x2]T
或者
x
=
(
v
1
x
)
v
1
+
(
v
2
x
)
v
2
x=(v_1x)v_1+(v_2x)v_2
x=(v1x)v1+(v2x)v2
特征值特征向量
A
X
=
λ
x
AX=\lambda x
AX=λx
该式子表示,矩阵A对于使上述式子成立的向量,只存在缩放作用。缩放因子就是特征值。
通过找到全部的特征向量和特征值,我们找到了一组基,在这组基下,矩阵A的作用只是纯粹的缩放。
对于实对称矩阵,特征向量两两正交,
x
x
T
=
I
xx^T=I
xxT=I 因此上式可改写成
A
=
x
λ
x
T
A=x\lambda x ^T
A=xλxT,则和奇异值分解类似。即将向量从x这组基旋转0度到x这组基,纯粹方向上进行缩放。
总结
特征值分解和奇异值分解都是给一个**线性变换(矩阵)**找一组特殊的基,其中,特征值分解 找到 特征向量 这组特殊的基,没有旋转效果只有缩放效果,缺点在于很多时候不正交,限制了一些应用,但表示和计算方便。
奇异值分解的应用实例
照片像素的存储。
任何一张照片都相当于一个存储像素数值的矩阵。如一张450333的照片,本来需要存储450333个像素值,进行奇异值分解后就变成了
A
=
∑
σ
i
μ
i
v
i
T
A=\sum\sigma_i\mu_iv_i^T
A=∑σiμiviT
且
σ
1
>
σ
2
.
.
.
.
.
.
>
0
\sigma_1>\sigma_2......>0
σ1>σ2......>0
根据存储量,可以只保留前几项奇异值较大的,就可以取得不错的效果
去噪
删掉一张照片里奇异值较小的几项,可以达到不错的效果