SVD理解和其在PCA,LSI的应用

最新推荐文章于 2024-07-20 17:25:24 发布

置顶

candice廷

最新推荐文章于 2024-07-20 17:25:24 发布

阅读量2.7k

点赞数

分类专栏：推荐系统&机器学习文章标签： SVD LSI PCA

本文链接：https://blog.csdn.net/xietingcandice/article/details/44976405

版权

本文深入浅出地介绍了奇异值分解（SVD）的概念及其在主成分分析（PCA）和潜在语义索引（LSI）中的应用。通过实例解析，阐述了SVD如何用于特征提取和数据压缩，以及在机器学习和搜索引擎优化中的重要作用。SVD不仅对方阵有效，还能处理非方阵，为非对称矩阵提供了重要特征的提取方法。

摘要由CSDN通过智能技术生成

首先确实是觉得这篇文章写得很好，后面的附录也是非常值得一看

整体框架转自

http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html

中间穿插一些自己的理解的部分

前言：

PCA的实现一般有两种，一种是用特征值分解去实现的，一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释（之后进行补充这一种方法）。特征值和奇异值在大部分人的印象中，往往是停留在纯粹的数学计算中。而且线性代数或者矩阵论里面，也很少讲任何跟特征值与奇异值有关的应用背景。奇异值分解是一个有着很明显的物理意义的一种方法，它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示，这些小矩阵描述的是矩阵的重要的特性。就像是描述一个人一样，给别人描述说这个人长得浓眉大眼，方脸，络腮胡，而且带个黑框的眼镜，这样寥寥的几个特征，就让别人脑海里面就有一个较为清楚的认识，实际上，人脸上的特征是有着无数种的，之所以能这么描述，是因为人天生就有着非常好的抽取重要特征的能力，让机器学会抽取重要的特征，SVD是一个重要的方法。

在机器学习领域，有相当多的应用与奇异值都可以扯上关系，比如做feature reduction的PCA，做数据压缩（以图像压缩为代表）的算法，还有做搜索引擎语义层次检索的LSI（Latent Semantic Indexing）

一、奇异值与特征值基础知识：

特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法。两者有着很紧密的关系，我在接下来会谈到，特征值分解和奇异值分解的目的都是一样，就是提取出一个矩阵最重要的特征。先谈谈特征值分解吧：

1）特征值：

如果说一个向量v是方阵A的特征向量，将一定可以表示成下面的形式：