SVD与CUR自我总结

最新推荐文章于 2022-11-12 18:59:36 发布

程哥哥吖

最新推荐文章于 2022-11-12 18:59:36 发布

阅读量661

点赞数 1

分类专栏：大数据系统与大规模数据分析文章标签： python 机器学习矩阵大数据数据分析

本文链接：https://blog.csdn.net/weixin_42200347/article/details/124889385

版权

大数据系统与大规模数据分析专栏收录该内容

24 篇文章 9 订阅

订阅专栏

本文介绍了奇异值分解(SVD)在图像压缩中的应用，通过取不同数量的奇异值展示其信息保留能力。同时，CUR矩阵分解相较于SVD在解释性和稀疏性上的优势，以及如何通过选取特定行列构建矩阵'骨架'来重构数据。

摘要由CSDN通过智能技术生成

SVD与CUR自我总结

参考：https://www.cnblogs.com/endlesscoding/p/10033527.html https://blog.csdn.net/WangWeb1998/article/details/114376298

1. SVD(奇异值分解)

定义：

有一个 $m\times n$ 的实数矩阵A，我么想要把它分解成如下形式：

其中 $U$ 和 $V$ 均为单位正交阵，即有 $UU^T=I$ 和 $VV^T=I$ ， $U$ 称为左奇异矩阵， $V$ 称为右奇异矩阵， $\Sigma$ 仅在主对角线上有值，我们称它为**奇异值**，其它元素均为0。上面矩阵的维度分别为 $U \in R m \times m, Σ \in R m \times n, V \in R n \times n$ 。一般的 $\Sigma$ 有如下形式：

在这里插入图片描述

奇异值求解

在这里插入图片描述

在图像压缩中的应用：

读取图片

%matplotlib inline
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np

img_eg = mpimg.imread("../img/beauty.jpg")
print(img_eg.shape)

图片大小为600x400x3

奇异值分解
```
img_temp = img_eg.reshape(600, 400 * 3)
U,Sigma,VT = np.linalg.svd(img_temp)
```
我们先将图片变成600×1200，再做奇异值分解。从svd函数中得到的奇异值sigma它是从大到小排列的

取前部分奇异值重构图片

# 取前60个奇异值
sval_nums = 60
img_restruct1 = (U[:,0:sval_nums]).dot(np.diag(Sigma[0:sval_nums])).dot(VT[0:sval_nums,:])
img_restruct1 = img_restruct1.reshape(600,400,3)

# 取前120个奇异值
sval_nums = 120
img_restruct2 = (U[:,0:sval_nums]).dot(np.diag(Sigma[0:sval_nums])).dot(VT[0:sval_nums,:])
img_restruct2 = img_restruct2.reshape(600,400,3)

将图片显示出来看一下，对比下效果:

fig, ax = plt.subplots(1,3,figsize = (24,32))

ax[0].imshow(img_eg)
ax[0].set(title = "src")
ax[1].imshow(img_restruct1.astype(np.uint8))
ax[1].set(title = "nums of sigma = 60")
ax[2].imshow(img_restruct2.astype(np.uint8))
ax[2].set(title = "nums of sigma = 120")

可以看到，当我们取到前面120个奇异值来重构图片时，基本上已经看不出与原图片有多大的差别。

总结：

从上面的图片的压缩结果中可以看出来，奇异值可以被看作成一个矩阵的代表值，或者说，奇异值能够代表这个矩阵的信息。**当奇异值越大时，它代表的信息越多。**因此，我们取前面若干个最大的奇异值，就可以基本上还原出数据本身。

2. CUR（矩阵分解）

提到矩阵分解，相信大家最熟悉的一定是SVD分解，但是SVD分解有两个缺点：

可解释性较差：对于SVD分解，大家通常的理解应该是，左奇异向量以及右奇异向量分别张成了原始矩阵所在的列空间以及行空间，但是对于原始矩阵而言，并没有较强的可解释性。
太过密集：就算原始矩阵是一个稀疏矩阵，该矩阵所分解而成的U、V矩阵仍然是高度密集的，这在某些应用场景下是难以接受的。
与SVD相比
CUR分解的可解释性大大加强了

在这里插入图片描述