从原理到实现--用SVD来压缩图像的详细教程

目录

一、SVD概述

二、实际案例讲解

1、相关函数库导入

2、定义压缩函数

2.1、函数参数值定义

2.2、定义svd函数

2.3、矩阵运算

2.4、计算结果保存为txt文件

3、图像导入压缩

4、图像对比展示

5、完整代码及结果展示

三、总结


一、SVD概述

SVD图像压缩通过分解和重构图像矩阵,以保留重要信息并减小数据量。这种技术在图像压缩和降维中有广泛的应用,可以在一定程度上平衡图像质量和文件大小。

二、实际案例讲解

实现一张图片像素压缩,通过SVD方法

1、相关函数库导入
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
  • numpy:用于数值计算和处理数组。
  • PIL中的Image模块:用于处理图像文件。
  • matplotlib.pyplot:用于图像可视化,将压缩前的图像和压缩后的图像进行展示。
2、定义压缩函数
2.1、函数参数值定义
def pic_compress(k,pic_array):
  • k:表示奇异值分解后要保留的奇异值数量。
  • pic_array:是一个包含图像像素值的NumPy数组,表示要进行压缩的原始图像。
2.2、定义svd函数
global u,sigma,vt,sig,new_pic #声明变量
u,sigma,vt = np.linalg.svd(pic_array) #进行SVD分解

u,sigma,vt均为奇异值分解的结果,具体讲解想看下列文章SVD推导:从线性代数到数据分析的关键算法

  • u:包含了输入矩阵pic_array的左奇异向量。
  • sigma:包含了奇异值,是一个对角矩阵,表示了pic_array的奇异值。
  • vt:包含了pic_array的右奇异向量的转置。
  • np.linalg.svd(pic_array):NumPy库中的奇异值分解函数。它接受一个矩阵pic_array作为输入,并返回分解后的三个部分:usigmavt
2.3、矩阵运算
sig = np.eye(k) * sigma[: k] #np.eye用于生成一个单位对角矩阵
new_pic = np.dot(np.dot(u[:, :k],sig),vt[:k,:]) #np.dot用于矩阵的乘法运算
size = u.shape[0] * k +sig.shape[0] * sig.shape[1]+ k * vt.shape[1]

这里将原始矩阵分解为三个矩阵的乘积,并计算相应的元素数量。

  • sig = np.eye(k) * sigma[: k]:这行代码创建了一个大小为k*k的对角矩阵sig,其中对角线上的元素由一维数组sigma的前 k 个元素构成。np.eye(k)创建了一个k*k的单位矩阵,然后将其乘以前k个sigma元素得到了对角矩阵sig
  • new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :]):执行矩阵乘法操作,将三个矩阵相乘,最终得到新的矩阵new_pic。
    • u[:, :k]:矩阵u的前k列。
    • vt[:k, :]:矩阵vt的前k行。
    • np.dot(u[:, :k], sig):将u的前k列与对角矩阵sig相乘。
    • np.dot(np.dot(u[:, :k], sig), vt[:k, :]):将前一步的结果与vt的前k行相乘,得到新的矩阵 new_pic
  • size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]:计算了矩阵usigvt 各自的大小,并将它们的元素数量相加,以计算整个操作所涉及的总元素数量。这通常用于了解内存占用或计算复杂度。
2.4、计算结果保存为txt文件
    with open('data1.txt','w') as f: #打开data1.txt文件
        np.savetxt(f, u,delimiter=',')
        f.write('================================')
        np.savetxt(f, sigma,delimiter=',')
        f.write('================================')
        np.savetxt(f, vt,delimiter=',')

使用NumPy库的np.savetxt函数,将名为u、sigma、vt的NumPy数组写入文件data1.txt中,使用逗号作为分隔符。这通常用于将数组数据保存到文本文件中。

注:np.savetxt是 NumPy 库中的一个函数,用于将 NumPy 数组保存到文本文件中。它的作用是将数组中的数据写入到一个文本文件中,以便稍后可以从文件中读取这些数据。

3、图像导入压缩
img = Image.open('gray.jpg')
ori_img = np.array(img)
new_img ,size = pic_compress(20,ori_img)
  • Image.open('gray.jpg'):打开所要压缩的图像,并加载为图像对象img。
  • ori_img = np.array(img):将图像对象img转换为NumPy数组,存储在ori_img中。
  • pic_compress(20,ori_img):调用定义的压缩函数,奇异值赋值为20,对加载的图像进行压缩。
4、图像对比展示
fig,ax = plt.subplots(1,2)
ax[0].imshow(ori_img,cmap='gray')
ax[0].set_title("before compress")
ax[1].imshow(new_img,cmap='gray')
ax[1].set_title("after compress")
plt.show()

创建一个包含两个子图的图形对象分别为压缩前图像(before compress)和压缩后图像(after compress),将两个子图并排展示在同一窗口中,使用户可以比较原始图像和经过压缩处理后的图像。

5、完整代码及结果展示
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

def pic_compress(k,pic_array):
    global u,sigma,vt,sig,new_pic

    u,sigma,vt = np.linalg.svd(pic_array)
    sig = np.eye(k) * sigma[: k]
    new_pic = np.dot(np.dot(u[:, :k],sig),vt[:k,:])
    size = u.shape[0] * k +sig.shape[0] * sig.shape[1]+ k * vt.shape[1]
   # print(u)
    print("===============")
    #print(sigma)
    print("===============")
   # print(vt)
    with open('data1.txt','w') as f:
        np.savetxt(f, u,delimiter=',')
        f.write('================================')
        np.savetxt(f, sigma,delimiter=',')
        f.write('================================')
        np.savetxt(f, vt,delimiter=',')

    return new_pic,size

img = Image.open('gray.jpg')
ori_img = np.array(img)
new_img ,size = pic_compress(20,ori_img)
print("original size:"+str(ori_img.shape[0]*ori_img.shape[1]))
print("compress size:"+str(size))
fig,ax = plt.subplots(1,2)
ax[0].imshow(ori_img,cmap='gray')
ax[0].set_title("before compress")
ax[1].imshow(new_img,cmap='gray')
ax[1].set_title("after compress")
plt.show()

图像压缩结果展示:

三、总结

本文介绍了奇异值分解 (SVD) 的一个实际应用案例,可以看到SVD是一种强大的图像压缩方法,有助于在减小图像尺寸的同时保留大部分重要的视觉信息。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值