目录
一、SVD概述
SVD图像压缩通过分解和重构图像矩阵,以保留重要信息并减小数据量。这种技术在图像压缩和降维中有广泛的应用,可以在一定程度上平衡图像质量和文件大小。
二、实际案例讲解
实现一张图片像素压缩,通过SVD方法
1、相关函数库导入
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
numpy
:用于数值计算和处理数组。PIL
中的Image
模块:用于处理图像文件。matplotlib.pyplot
:用于图像可视化,将压缩前的图像和压缩后的图像进行展示。
2、定义压缩函数
2.1、函数参数值定义
def pic_compress(k,pic_array):
- k:表示奇异值分解后要保留的奇异值数量。
- pic_array:是一个包含图像像素值的NumPy数组,表示要进行压缩的原始图像。
2.2、定义svd函数
global u,sigma,vt,sig,new_pic #声明变量
u,sigma,vt = np.linalg.svd(pic_array) #进行SVD分解
u,sigma,vt均为奇异值分解的结果,具体讲解想看下列文章SVD推导:从线性代数到数据分析的关键算法
- u:包含了输入矩阵
pic_array
的左奇异向量。 - sigma:包含了奇异值,是一个对角矩阵,表示了
pic_array
的奇异值。 - vt:包含了
pic_array
的右奇异向量的转置。 - np.linalg.svd(pic_array):NumPy库中的奇异值分解函数。它接受一个矩阵
pic_array
作为输入,并返回分解后的三个部分:u
、sigma
和vt
。
2.3、矩阵运算
sig = np.eye(k) * sigma[: k] #np.eye用于生成一个单位对角矩阵
new_pic = np.dot(np.dot(u[:, :k],sig),vt[:k,:]) #np.dot用于矩阵的乘法运算
size = u.shape[0] * k +sig.shape[0] * sig.shape[1]+ k * vt.shape[1]
这里将原始矩阵分解为三个矩阵的乘积,并计算相应的元素数量。
- sig = np.eye(k) * sigma[: k]:这行代码创建了一个大小为k*k的对角矩阵
sig
,其中对角线上的元素由一维数组sigma
的前 k 个元素构成。np.eye(k)
创建了一个k*k的单位矩阵,然后将其乘以前k个sigma
元素得到了对角矩阵sig
。 - new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :]):执行矩阵乘法操作,将三个矩阵相乘,最终得到新的矩阵
new_pic。
- u[:, :k]:矩阵
u
的前k列。 - vt[:k, :]:矩阵vt的前k行。
- np.dot(u[:, :k], sig):将
u
的前k列与对角矩阵sig
相乘。 - np.dot(np.dot(u[:, :k], sig), vt[:k, :]):将前一步的结果与
vt
的前k行相乘,得到新的矩阵new_pic
。
- u[:, :k]:矩阵
- size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]:计算了矩阵
u
、sig
和vt
各自的大小,并将它们的元素数量相加,以计算整个操作所涉及的总元素数量。这通常用于了解内存占用或计算复杂度。
2.4、计算结果保存为txt文件
with open('data1.txt','w') as f: #打开data1.txt文件
np.savetxt(f, u,delimiter=',')
f.write('================================')
np.savetxt(f, sigma,delimiter=',')
f.write('================================')
np.savetxt(f, vt,delimiter=',')
使用NumPy库的np.savetxt
函数,将名为u
、sigma、vt的NumPy数组写入文件data1.txt中,使用逗号作为分隔符。这通常用于将数组数据保存到文本文件中。
注:np.savetxt
是 NumPy 库中的一个函数,用于将 NumPy 数组保存到文本文件中。它的作用是将数组中的数据写入到一个文本文件中,以便稍后可以从文件中读取这些数据。
3、图像导入压缩
img = Image.open('gray.jpg')
ori_img = np.array(img)
new_img ,size = pic_compress(20,ori_img)
- Image.open('gray.jpg'):打开所要压缩的图像,并加载为图像对象img。
- ori_img = np.array(img):将图像对象
img
转换为NumPy数组,存储在ori_img
中。 - pic_compress(20,ori_img):调用定义的压缩函数,奇异值赋值为20,对加载的图像进行压缩。
4、图像对比展示
fig,ax = plt.subplots(1,2)
ax[0].imshow(ori_img,cmap='gray')
ax[0].set_title("before compress")
ax[1].imshow(new_img,cmap='gray')
ax[1].set_title("after compress")
plt.show()
创建一个包含两个子图的图形对象分别为压缩前图像(before compress)和压缩后图像(after compress),将两个子图并排展示在同一窗口中,使用户可以比较原始图像和经过压缩处理后的图像。
5、完整代码及结果展示
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
def pic_compress(k,pic_array):
global u,sigma,vt,sig,new_pic
u,sigma,vt = np.linalg.svd(pic_array)
sig = np.eye(k) * sigma[: k]
new_pic = np.dot(np.dot(u[:, :k],sig),vt[:k,:])
size = u.shape[0] * k +sig.shape[0] * sig.shape[1]+ k * vt.shape[1]
# print(u)
print("===============")
#print(sigma)
print("===============")
# print(vt)
with open('data1.txt','w') as f:
np.savetxt(f, u,delimiter=',')
f.write('================================')
np.savetxt(f, sigma,delimiter=',')
f.write('================================')
np.savetxt(f, vt,delimiter=',')
return new_pic,size
img = Image.open('gray.jpg')
ori_img = np.array(img)
new_img ,size = pic_compress(20,ori_img)
print("original size:"+str(ori_img.shape[0]*ori_img.shape[1]))
print("compress size:"+str(size))
fig,ax = plt.subplots(1,2)
ax[0].imshow(ori_img,cmap='gray')
ax[0].set_title("before compress")
ax[1].imshow(new_img,cmap='gray')
ax[1].set_title("after compress")
plt.show()
图像压缩结果展示:
三、总结
本文介绍了奇异值分解 (SVD) 的一个实际应用案例,可以看到SVD是一种强大的图像压缩方法,有助于在减小图像尺寸的同时保留大部分重要的视觉信息。