《推荐系统笔记（五）》svd降维 —— 以图片处理为例

最新推荐文章于 2024-12-25 19:16:24 发布

wangxinRS

最新推荐文章于 2024-12-25 19:16:24 发布

阅读量889

点赞数 1

分类专栏：矩阵分解文章标签：推荐系统

本文链接：https://blog.csdn.net/qq_30841655/article/details/107633010

版权

矩阵分解专栏收录该内容

4 篇文章

订阅专栏

理论部分

任何一个 $m\times n$ 矩阵 $A$ ，通过svd分解，可以分解为三个矩阵相乘
$A=P\Sigma Q^T$

其中， $\Sigma$ 是一个 $m\times n$ 对角矩阵，除了对角线上的元素之外，其余位置元素全部为0。

我们假设 $P=[P_1, P_2, ..., P_m]$ ，其中， $P_i$ 是 $m$ 维列向量； $Q=[Q_1, Q_2, ..., Q_n]$ ，其中， $Q_j$ 是 $n$ 维列向量； $\Sigma$ 的对角线元素为 $\sigma_1, \sigma_2, ..., \sigma_{min(m, n)}$ ，其中， $\sigma_1\ge\sigma_2\ge...\ge\sigma_{min(m, n)}$ 。

我们仅考虑 $m\ge n$ 的情形（情形 $m\le n$ 类似）。此时，矩阵 $A$ 可以分解为
$\begin{array}{lll} A&=&P\Sigma Q^T\\ &=&[P_1, P_2, ..., P_m]\Sigma[Q_1^T, Q_2^T, ..., Q_n^T]^T\\ &=&\sigma_1 P_1 Q_1^T+\sigma_2 P_2 Q_2^T+...+\sigma_nP_nQ_n^T \end{array}$

更重要的是，对角线上的元素按照从大到小，从上到下进行排列，并且往往最大的几个元素比最小的几个元素大得多，以至于较小元素可以忽略。

比如，我们有100个特征值，前10%的特征值比后90%的特征值大得多，我们就选取前10%的特征值，而将后90%的特征值略掉。这样，我们就用了10%的内容，保留了矩阵 $A$ 的绝大部分信息。

此时，保留前 $k$ 个特征值，
$A\approx\sigma_1 P_1 Q_1^T+\sigma_2 P_2 Q_2^T+...+\sigma_kP_kQ_k^T$

实际操作

我们随便挑选一个图片作为例子，保存为dog.jpg
在这里插入图片描述
我们可以从图片处理中，看看svd降维的效果。

# 第三方库
from PIL import Image
from scipy.linalg import svd
import numpy as np

# 加载图片
image = Image.open('D:/myfile/开课吧/推荐系统/第六节/dog.jpg')

# 转化为灰度图
grey_image = image.convert('L')
grey_image.show()

转化为灰度图，如下
在这里插入图片描述

# 转化为矩阵
A = np.array(grey_image)

# svd分解
p, s, q = svd(A)
print('左奇异矩阵p的大小为', p.shape)
print('矩阵A的特征值个数为', len(s))
print('其中，前4个特征值为', s[:4])
print('后4个特征值为', s[-4:])
print('右奇异矩阵q的大小为', q.shape)

左奇异矩阵p的大小为 (683, 683)
矩阵A的特征值个数为 683
其中，前4个特征值为 [109075.24   28300.275  16735.781  10259.204]
后4个特征值为 [28.534803 27.757359 26.593216 23.755302]
右奇异矩阵q的大小为 (1024, 1024)

可以看到，前4个特征值要比后4个特征值大得多，所以将后四个特征值忽略，并不影响图片质量。

# 定义函数get_k_features，选择矩阵A的前k个特征值，返回图像矩阵
# 注意：该函数仅适用于m<n的A矩阵
def get_k_features(k):
    # 生成sigma矩阵
    sigma = np.diag(list(s)+[0]*(len(q)-len(s)))[:len(s), :] # m*n矩阵，其中，对角线上是m个特征值
    
    # 选取前k个特征值
    sigma_k = sigma[:k, :] # k*n矩阵
    
    # 近似还原A矩阵
    A_approx = p[:, :k].dot(sigma_k).dot(q) # p矩阵需要取前k列，变成m*k矩阵；sigma_k是k*n矩阵；q是n*n矩阵
    
    return A_approx

# 取前5%的特征值
image_1 = get_k_features(30)
# 取前10%的特征值
image_2 = get_k_features(60)
# 取前20%的特征值
image_3 = get_k_features(120)

# 依次生成图片
Image_1 = Image.fromarray(np.uint8(image_1))
Image_1.show()

Image_2 = Image.fromarray(np.uint8(image_1))
Image_2.show()

Image_3 = Image.fromarray(np.uint8(image_1))
Image_3.show()