奇异值分解（SVD）

最新推荐文章于 2024-05-16 11:19:15 发布

Rick_rui

最新推荐文章于 2024-05-16 11:19:15 发布

阅读量3.5k

点赞数 1

文章标签： p2p 网络协议网络

本文链接：https://blog.csdn.net/Rick_rui/article/details/124899046

版权

1. 回顾特征值和特征向量

首先回顾下特征值和特征向量的定义如下：

$Ax=\lambda x$

其中 $A$ 是一个 $n\times n$ 矩阵， $x$ 是一个 $n$ 维向量，则 $\lambda$ 是矩阵 $A$ 的一个特征值，而 $x$ 是矩阵 $A$ 的特征值 $\lambda$ 所对应的特征向量。

求出特征值和特征向量有什么好处呢？就是我们可以将矩阵A特征分解。如果我们求出了矩阵A的n个特征值 $\lambda _{1}\leqslant \lambda _{2}\leqslant ...\leqslant \lambda _{n}$ ，以及这 $n$ 个特征值所对应的特征向量 .

那么矩阵 $A$ 就可以用下式的特征分解表示：

$A=W\sum W^{-1}$

其中W是这n个特征向量所张成的 $n\times n$ 维矩阵，而Σ为这n个特征值为主对角线的n×n维矩阵。

一般我们会把W的这n个特征向量标准化，即满足 $\left \| w_{i} \right \|_{2}=1$ ，或者 ${w_{i}}^{T}{w_{i}}=1$ ，此时W的

n个特征向量为标准正交基，满足 $W^{T}W=I$ ，即 $W^{T}=W^{-1}$ .

这样我们的特征分解表达式可以写成: $A=W\sum W^{T}$

注意到要进行特征分解，矩阵A必须为方阵。

那么如果A不是方阵，即行和列不相同时，我们还可以对矩阵进行分解吗？答案是可以，此时我们的SVD登场了。

2. SVD的定义

SVD也是对矩阵进行分解，但是和特征分解不同，SVD并不要求要分解的矩阵为方阵。假设我们的矩阵A是一个m×n的矩阵，那么我们定义矩阵A的SVD为： $A=U\sum V^{T}$ 其中U 是一个 m×m的矩

阵，Σ是一个m×n的矩阵，除了主对角线上的元素以外全为0，主对角线上的每个元素都称为奇异

值，V是一个 n×n 的矩阵。 U和 V都是酉矩阵，即满足 $U^{T}U=I$ , $V^{T}V=I$ 。下图可以很形象的看

出上面SVD的定义：

那么我们如何求出SVD分解后的U,Σ,V这三个矩阵呢？

如果我们将A的转置和A做矩阵乘法，那么会得到n×n的一个方阵 $A^{T}A$ 。既然 $A^{T}A$ 是方阵，那么我们就可以进行特征分解，得到的特征值和特征向量满足下式：

$(A^{T}A)v_{i}=\lambda _{i}v_{i}$

这样我们就可以得到矩阵 $A^{T}A$ 的n个特征值和对应的n个特征向量v了。将 $A^{T}A$ 的所有特征向量张成一个n×n的矩阵V，就是我们SVD公式里面的V矩阵了。一般我们将V中的每个特征向量叫做A的右奇异向量。

如果我们将A和A的转置做矩阵乘法，那么会得到m×m的一个方阵 $A^{T}A$ 。既然 $A^{T}A$ 是方阵，那么我们就可以进行特征分解，得到的特征值和特征向量满足下式：

$(A^{T}A)u_{i}=\lambda _{i}u_{i}$

这样我们就可以得到矩阵 $A^{T}A$ 的m个特征值和对应的m个特征向量u了。将 $A^{T}A$ 的所有特征向量张成一个m×m的矩阵U，就是我们SVD公式里面的U矩阵了。一般我们将U中的每个特征向量叫做A的左奇异向量。

U和V我们都求出来了，现在就剩下奇异值矩阵Σ没有求出了.

由于Σ除了对角线上是奇异值其他位置都是0，那我们只需要求出每个奇异值σ就可以了。

我们注意到:

$A=U\sum V^{T} \Rightarrow AV=U\sum V^{T}V \Rightarrow AV=U\sum \Rightarrow Av_{i}=\sigma_{i}u_{i}\Rightarrow \sigma _{i}= Av_{i}/u_{i}$

这样我们可以求出我们的每个奇异值，进而求出奇异值矩阵Σ。

上面还有一个问题没有讲，就是我们说 $A^{T}A$ 的特征向量组成的就是我们SVD中的V矩阵，而

$A^{T}A$ 的特征向量组成的就是我们SVD中的U矩阵，这有什么根据吗？这个其实很容易证明，我们以V矩阵的证明为例。

$A=U\sum V^{T} \Rightarrow A^{T}=V\sum U^{T} \Rightarrow A^{T}A=V\sum U^{T} U\sum V^{T} =V\sum ^{2}V^{T}$

可以看出 $A^{T}A$ 的特征向量组成的的确就是我们SVD中的V矩阵。类似的方法可以得到 $A^{T}A$ 的特征向量组成的就是我们SVD中的U矩阵。

进一步我们还可以看出我们的特征值矩阵等于奇异值矩阵的平方，也就是说特征值和奇异值满足如下关系：

$\sigma _{i}=\sqrt{\lambda _{i}}$

这样也就是说，我们可以不用 $\sigma _{i}=\frac{Av_{i}}{u_{i}}$ 来计算奇异值，也可以通过求出 $A^{T}A$ 的特征值取平方根来求奇异值。

3. SVD计算举例

这里我们用一个简单的例子来说明矩阵是如何进行奇异值分解的。我们的矩阵A定义为：

首先求出 $A^{T}A$ 和 $AA^{T}$

进而求出 $A^{T}A$ 的特征值和特征向量：

接着求出 $AA^{T}$ 的特征值和特征向量：

利用 $Av_{i}=\sigma _{i}u_{i},i=1,2$ 求奇异值：

也可以用 $\sigma _{i}=\sqrt{\lambda _{i}}$ 直接求出奇异值为 $\sqrt3$ 和1.

最终得到A的奇异值分解为：

Rick_rui

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
奇异值分解（SVD）

1. 回顾特征值和特征向量首先回顾下特征值和特征向量的定义如下：其中是一个矩阵，是一个维向量，则是矩阵的一个特征值，而是矩阵的特征值所对应的特征向量。求出特征值和特征向量有什么好处呢？就是我们可以将矩阵A特征分解。如果我们求出了矩阵A的n个特征值，以及这个特征值所对应的特征向量 .那么矩阵就可以用下式的特征分解表示：其中W是这n个特征向量所张成的...
复制链接

扫一扫