奇异值分解（Singular Value Decomposition, SVD）

最新推荐文章于 2024-06-28 15:10:06 发布

Shingle_

最新推荐文章于 2024-06-28 15:10:06 发布

阅读量1.1k

点赞数 2

分类专栏：机器学习自然语言处理文章标签：奇异值分解 SVD 矩阵分解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Shingle_/article/details/81989046

版权

机器学习同时被 2 个专栏收录

48 篇文章 2 订阅

订阅专栏

自然语言处理

27 篇文章 0 订阅

订阅专栏

提取信息的强大工具。简化数据、去除噪声、提高算法结果。

利用SVD实现，我们能够用小得多的数据集来表示原始数据集。这样做，实际上是去除了噪声和冗余信息。SVD时一种强大的降维工具，可以利用SVD来逼近矩阵并从中提取重要特征，通过保留矩阵80%~90%的能量，就可以得到重要特征并去掉噪声。

SVD的应用

这里先介绍SVD可能的用途，下一节介绍SVD相关知识。

隐语义索引

SVD的历史超过了上百个年头，但在最近几十年中，我们发现了它在计算机领域的更多的使用价值。最早的SVD应用之一就是信息检索。我们称利用SVD的方法为隐性语义索引（Latent Semantic Indexing, LSI） 或者 隐性语义分析（Latent Semantic Analysis, LSA）.

在LSI中，一个矩阵是由文档和词语组成的。当我们在该矩阵上应用SVD时，就会构建出多个奇异值。这些奇异值代表了文档中的概念或主题，这个特点可以用于更高效的文档检索。

见Blog 主题模型 https://blog.csdn.net/Shingle_/article/details/81989090

推荐系统

简单版本的推荐系统能够计算项或者人之间的相似度。更先进的方法是利用SVD从数据中构建一个主题空间，然后在该空间下计算相似度。

见Blog 推荐系统 https://blog.csdn.net/Shingle_/article/details/82290427

数据压缩、数据降维

如图像压缩

矩阵分解之SVD

这里写图片描述

D a t a m \times n = U m \times m Σ m \times n V T n \times n

${Data}_{m\times n}=U_{m\times m}\mathrm{\Sigma}_{m\times n}V_{n\times n}^T$

import numpy as np
A = np.array([[4,0],[3,-5]])
U, Sigma, VT = np.linalg.svd(A)

SVD的求解过程

Step 1. Compute its transpose A^T and A^TA
Step 2. Determine the eigenvalues of A^TA and sort these in descending order, in the absolute sense. Square roots these to obtain the singular values of A.
Step 3. Construct diagnal matrix S by placing singular values in descending order along its diagonal. Compute its inverse, S^-1.
Step 4. Use the ordered eigenvalues from step2 and compute the eigenvectors of A^TA. Place these eigenvectors along the columns of V and compute its transposem, V^T.
Step 5. Compute U as U=AVS^-1. To complete the proof, compute the full SVD using A=USV^T.

U、V是正交矩阵，S是对角矩阵。

对比PCA：PCA中得到的是矩阵的特征值，得到数据的重要特征。奇异值是矩阵Data * Data^T特征值的平方根。

https://cs.fit.edu/~dmitra/SciComp/Resources/singular-value-decomposition-fast-track-tutorial.pdf

http://www.ce.yildiz.edu.tr/personal/banud/file/1201/latent-semantic-indexing-fast-track-tutorial.pdf

《Machine Learning in Action》 14.1 P253

《Introduce to LINEAR AlGEBRA》 6.7 P364

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。