基础算法 --- > SVD

最新推荐文章于 2025-02-14 10:51:10 发布

chencas

最新推荐文章于 2025-02-14 10:51:10 发布

阅读量756

点赞数 4

CC 4.0 BY-SA版权

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/chencas/article/details/103888115

奇异值分解(SVD)是机器学习中的重要算法，适用于降维、推荐系统和自然语言处理等领域。SVD将非方阵分解为两个正交矩阵和一个对角矩阵，其中对角矩阵的元素为奇异值。对于方阵，可以进行特征分解，找到特征值和特征向量。非方阵的特征分解则需借助SVD。SVD的奇异值在多数情况下占据总和的大部分，可用于数据压缩和PCA降维。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

奇异值分解(Singular Value Decomposition，以下简称SVD)是在机器学习领域广泛应用的算法，它不光可以用于降维算法中的特征分解，还可以用于推荐系统，以及自然语言处理等领域。是很多机器学习算法的基石。

奇异值分解（SVD）通俗一点讲就是将一个线性变换分解为两个线性变换，一个线性变换代表旋转，一个线性变换代表拉伸

注：SVD是将一个矩阵分解成两个正交矩阵和一个对角矩阵，我们知道正交矩阵对应的变换是旋转变换，对角矩阵对应的变换是伸缩变换。

矩阵知识

特征值和特征向量

关于特征值和特征向量的定义如下：
$\lambda x$

其中 $A\in R^{n\times n}$ 的一个矩阵，x是一个n维向量 $x\in R^n$ ，如果上式成立，我们则称 $\lambda$ 为矩阵A的特征值，称x为 $\lambda$ 对应的特征向量。

例子：

特征分解

如果我们求出了矩阵A的n个特征值 $\lambda_1\leq \lambda_2\leq ... \lambda_n$ ，以及这n个特征值所对应的特征向量 ${ {w_1, w_2, ..., w_n\}}$ ，如果这n个特征向量线性无关，那么矩阵A就可以用下式的特征分解表示:
$W\Sigma W^{-1}$
其中 $W = (w_1, w_2, ..., w_n)$ ， $\Sigma =\begin{pmatrix} \lambda_1 & \\ ... & ... \\ & \lambda_n \end{pmatrix}$
一般我们会把W的这n个特征向量标准化，即满足 $w_i||_2=1$ ，或者说 $w^T_i w_i=1$ ，此时W的n个特征向量为标准正交基，且满足 $W^TW=I$ ，即W为酉矩阵（unitary matrix）。

注意，这里进行特征分解的矩阵必须是方阵，但我们的数据常常不是方阵，对于 $n\times m$ 的矩阵怎么矩阵分解？SVD算法解决该类问题。

特征分解的几何意义

首先，要明确的是，一个矩阵其实就是一个线性变换，因为一个矩阵乘以一个向量后得到的向量，其实就相当于将这个向量进行了线性变换。比如说下面的一个矩阵：

$\begin{bmatrix} 3&0\\ 0 & 1 \end{bmatrix}$
当我们对一个坐标变换时有：
$\begin{bmatrix} 3&0\\ 0 & 1 \end{bmatrix} \begin{bmatrix} x\\ y \end{bmatrix} = \begin{bmatrix} 3x\\ y \end{bmatrix}$
它其实对应的线性变换是下面的形式：