从原理到实现--用SVD来压缩图像的详细教程

AI_dataloads

已于 2023-10-11 10:34:14 修改

阅读量2k

点赞数 2

文章标签：图像处理

于 2023-10-08 21:16:02 首次发布

本文链接：https://blog.csdn.net/AI_dataloads/article/details/133688702

版权

一、SVD概述

SVD图像压缩通过分解和重构图像矩阵，以保留重要信息并减小数据量。这种技术在图像压缩和降维中有广泛的应用，可以在一定程度上平衡图像质量和文件大小。

二、实际案例讲解

实现一张图片像素压缩，通过SVD方法

1、相关函数库导入

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

numpy：用于数值计算和处理数组。
PIL中的Image模块：用于处理图像文件。
matplotlib.pyplot：用于图像可视化，将压缩前的图像和压缩后的图像进行展示。

2、定义压缩函数

2.1、函数参数值定义

def pic_compress(k,pic_array):

k：表示奇异值分解后要保留的奇异值数量。
pic_array：是一个包含图像像素值的NumPy数组，表示要进行压缩的原始图像。

2.2、定义svd函数

global u,sigma,vt,sig,new_pic #声明变量
u,sigma,vt = np.linalg.svd(pic_array) #进行SVD分解

u,sigma,vt均为奇异值分解的结果，具体讲解想看下列文章SVD推导：从线性代数到数据分析的关键算法

u：包含了输入矩阵pic_array的左奇异向量。
sigma：包含了奇异值，是一个对角矩阵，表示了pic_array的奇异值。
vt：包含了pic_array的右奇异向量的转置。
np.linalg.svd(pic_array)：NumPy库中的奇异值分解函数。它接受一个矩阵pic_array作为输入，并返回分解后的三个部分：u、sigma和vt。

2.3、矩阵运算

sig = np.eye(k) * sigma[: k] #np.eye用于生成一个单位对角矩阵
new_pic = np.dot(np.dot(u[:, :k],sig),vt[:k,:]) #np.dot用于矩阵的乘法运算
size = u.shape[0] * k +sig.shape[0] * sig.shape[1]+ k * vt.shape[1]

这里将原始矩阵分解为三个矩阵的乘积，并计算相应的元素数量。

sig = np.eye(k) * sigma[: k]：这行代码创建了一个大小为k*k的对角矩阵sig，其中对角线上的元素由一维数组sigma的前 k 个元素构成。np.eye(k)创建了一个k*k的单位矩阵，然后将其乘以前k个sigma元素得到了对角矩阵sig。
new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :])：执行矩阵乘法操作，将三个矩阵相乘，最终得到新的矩阵new_pic。
- u[:, :k]：矩阵u的前k列。
- vt[:k, :]：矩阵vt的前k行。
- np.dot(u[:, :k], sig)：将u的前k列与对角矩阵sig相乘。
- np.dot(np.dot(u[:, :k], sig), vt[:k, :])：将前一步的结果与vt的前k行相乘，得到新的矩阵 new_pic。
size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]：计算了矩阵u、sig和vt 各自的大小，并将它们的元素数量相加，以计算整个操作所涉及的总元素数量。这通常用于了解内存占用或计算复杂度。

2.4、计算结果保存为txt文件

    with open('data1.txt','w') as f: #打开data1.txt文件
        np.savetxt(f, u,delimiter=',')
        f.write('================================')
        np.savetxt(f, sigma,delimiter=',')
        f.write('================================')
        np.savetxt(f, vt,delimiter=',')

使用NumPy库的np.savetxt函数，将名为u、sigma、vt的NumPy数组写入文件data1.txt中，使用逗号作为分隔符。这通常用于将数组数据保存到文本文件中。

注：np.savetxt是 NumPy 库中的一个函数，用于将 NumPy 数组保存到文本文件中。它的作用是将数组中的数据写入到一个文本文件中，以便稍后可以从文件中读取这些数据。

3、图像导入压缩

img = Image.open('gray.jpg')
ori_img = np.array(img)
new_img ,size = pic_compress(20,ori_img)

Image.open('gray.jpg')：打开所要压缩的图像，并加载为图像对象img。
ori_img = np.array(img)：将图像对象img转换为NumPy数组，存储在ori_img中。
pic_compress(20,ori_img)：调用定义的压缩函数，奇异值赋值为20，对加载的图像进行压缩。

4、图像对比展示

fig,ax = plt.subplots(1,2)
ax[0].imshow(ori_img,cmap='gray')
ax[0].set_title("before compress")
ax[1].imshow(new_img,cmap='gray')
ax[1].set_title("after compress")
plt.show()

创建一个包含两个子图的图形对象分别为压缩前图像(before compress)和压缩后图像(after compress),将两个子图并排展示在同一窗口中，使用户可以比较原始图像和经过压缩处理后的图像。

5、完整代码及结果展示

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

def pic_compress(k,pic_array):
    global u,sigma,vt,sig,new_pic

    u,sigma,vt = np.linalg.svd(pic_array)
    sig = np.eye(k) * sigma[: k]
    new_pic = np.dot(np.dot(u[:, :k],sig),vt[:k,:])
    size = u.shape[0] * k +sig.shape[0] * sig.shape[1]+ k * vt.shape[1]
   # print(u)
    print("===============")
    #print(sigma)
    print("===============")
   # print(vt)
    with open('data1.txt','w') as f:
        np.savetxt(f, u,delimiter=',')
        f.write('================================')
        np.savetxt(f, sigma,delimiter=',')
        f.write('================================')
        np.savetxt(f, vt,delimiter=',')

    return new_pic,size

img = Image.open('gray.jpg')
ori_img = np.array(img)
new_img ,size = pic_compress(20,ori_img)
print("original size:"+str(ori_img.shape[0]*ori_img.shape[1]))
print("compress size:"+str(size))
fig,ax = plt.subplots(1,2)
ax[0].imshow(ori_img,cmap='gray')
ax[0].set_title("before compress")
ax[1].imshow(new_img,cmap='gray')
ax[1].set_title("after compress")
plt.show()

图像压缩结果展示：