SVD矩阵奇异值分解

wiselisx

已于 2024-03-07 19:40:17 修改

阅读量1.6k

点赞数 28

文章标签：线性代数

于 2024-03-07 19:35:34 首次发布

本文链接：https://blog.csdn.net/wiselisx/article/details/136543864

版权

本文介绍了SVD（奇异值分解）在处理稀疏矩阵中的应用，通过分解为正交矩阵、对角矩阵和另一个矩阵的乘积，实现矩阵的尺寸压缩并保持重要信息。文中详细阐述了特征值和特征向量的概念，以及如何通过SVD对非方阵进行分解的过程。

摘要由CSDN通过智能技术生成

SVD矩阵奇异值分解

前言

为了使计算机理解实际问题体中目标各项特征，通常使用方阵来储存这些特征值，例如一个人的年龄，身高，体重可以使用 $[32, 185, 75]$ 进行表示。但是对于有些问题，其特征矩阵是稀疏矩阵，矩阵内部许多向量都为0，例如矩阵 $O$ 。这即造成储存空间的浪费，同时消耗了计算资源，那能不能即压缩矩阵的大小，且保留矩阵的重要信息呢？这时候可以用到SVD矩阵奇异值分解。

$O=\begin{bmatrix} 0 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \end{bmatrix}$

SVD矩阵奇异值分解

SVD可以将任意一个矩阵分解为一个正交矩阵、一个对焦矩阵和另外一个对角矩阵的乘积。对角矩阵的对角元称为矩阵的奇异值，可以证明，奇异值总是大于等于0的。当对角矩阵的奇异值按从大到小排列时，SVD分解是唯一的。

特征值与特征向量

理解SVD之前必需搞懂两个概念，特征值与特征向量，假设存在一个 $n * n$ 矩阵 $A$ ，存在一个 $n$ 维矩阵 $x$ 和一个特征值 $\lambda$ ，使得式 $(1)$ 成立。

$\lambda x\tag{1}$

则 $\lambda$ 即为 $A$ 的特征值， $x$ 为 $A$ 的特征向量。那如何求取矩阵 $A$ 的特征值和特征向量呢？计算如下：

$\begin{align} Ax-\lambda x = 0\tag{2} \\ (A - \lambda E)x = 0 \tag{3}\\ \end{align}$

如果 $（ 3 ）$ 式成立,即求：

$\lambda E | = 0 \tag{4}$

即可求出了矩阵 $A$ 的 $n$ 个特征值 $\lambda_1 \leqslant \lambda_2 \leqslant ... \leqslant \lambda_{n-1} \leqslant \lambda_n$ ，以及这 $n$ 个特征值所对应的特征向量 $x_1,x_2,...,x_{n-1},x_n$ 。

最后矩阵 $A$ 就可以进行SVD分解，用 $（ 5 ）$ 式进行表示：

$W\sum W^{-1} \tag{5}$

其中 $W$ 是这 $n$ 个特征向量所张成的 $n \times n$ 维矩阵， $W = [x_1,x_2,...,x_n]$ ,而 $\sum$ 为这 $n$ 个特征值为主对角线的 $n \times n$ 维矩阵, $O=\begin{bmatrix}\sigma_1 & 0 & \cdots & 0 \\0 & \sigma_2& \cdots & 0 \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \cdots &\sigma_n\end{bmatrix}$ 。

‍

W的这n个特征向量会进行标准化，即满足 $W_i||^2=1$ ，或者 $w^t_i w_i=1$ ，此时W的n个特征向量为标准正交基，满足 $W^TW = I$ ，即 $W^T = W^{-1}$ ，也就是说W为酉矩阵。

这样我们的特征分解表达式可以写成

$W\sum W^{T} \tag{6}$

注意到要进行特征分解，矩阵A必须为方阵。那么如果A不是方阵，即行和列不相同时，我们还可以对矩阵进行分解吗？答案是可以，此时我们的SVD登场了。

非方阵进行求解

假设 $A$ 是一个 $m * n$ 的矩阵，那么定义A都SVD分解为式 $（ 6 ）$ ：

$U\sum V^{T} \tag{7}$

其中 $U$ 是一个 $m *$ * $m$ 的矩阵， $\sum$ 是一个 $m *$  $n$ 的矩阵， $V$ 是一个 $n * n$ 的矩阵，U*和 V 都是酉矩阵，即满足 $UU^T = VV^T = I$ 。那如何求解这三个矩阵呢？

求解矩阵 $V$

如果我们将A的转置和A做矩阵乘法，那么会得到 $n \times n$ 的一个方阵 $A^TA$ ,因为 $A^{T}= V\sum^{T} U^{T}$ , $UU^T = I$ 。故 $A^TA =V UU^T \sum^2 V^{T} =V\sum^2 V^{T}$ ，求解特征值和特征向量满足下式（8）：