上采样方式:(1)近邻插值法,即复制扩张存在像素,其信息量不会增加,opencv实现:resize()
(2) 高斯金字塔,即先近邻插值再高斯滤波,opencv实现:pyrUp()
同理
下采样方式:(1)隔行取值,图像信息量会丢失,opencv实现:resize()
(2) 高斯金字塔,即先滤波再隔行取值,opencv实现:pyrDown()
需要注意到,上采样过程不会增加信息量,下采样过程会丢失信息量。拉普拉斯金字塔做法是:对于一个下采样的高斯金字塔,其信息量是不断减少的,为了获取丢失的信息量的大小,只需前后两级图片相减即可,考虑到图片大小不一致,故对较小图片pyrUp获取一致大小(信息量没有增加)再相减,即可获得信息差。将每一层信息差保存为拉普拉斯金字塔,当然拉普拉斯金字塔第一层为最小分辨率初始图片,有了各层的信息差,我们就可以复原任意级别的图片。在频域上,拉普拉斯金字塔可以理解为保存的是信号各频带信息,下面给出例子:
import cv2
import numpy as np
import math
# 定义生成拉普拉斯金字塔
def generate_laplacian_pyramid(img,lowest_res):
# 最小分辨率
lowest_level = int(math.log(lowest_res, 2))
# 最大分辨率
highest_res = img.shape[0]
highest_level = int(math.log(highest_res,2))
# 构建高斯金字塔
G_PYD = []
for level in range(highest_level,lowest_level-1,-1):
if level==highest_level:
G_PYD.append(img)
else:
img = cv2.pyrDown(img) # 下采样
G_PYD.append(img)
G_PYD = list(reversed(G_PYD)) # 逆置
# # 构建拉普拉斯金字塔
L_PYD = []
L_PYD.append(G_PYD[0])
for idx in range(1,len(G_PYD)):
# 下采样+上采样,减少信息量
dim = cv2.pyrDown(G_PYD[idx])
dim = cv2.pyrUp(dim)
# 获取指定频带信息
L_PYD.append(abs(G_PYD[idx]-dim))
return L_PYD
img = cv2.imread(r'./man.jpg')
img = cv2.resize(img,(256,256))
L = generate_laplacian_pyramid(img,32)
for each in L:
cv2.imshow(' ',each)
cv2.waitKey(0)
32x32 初始图片
32x32 到 64x64 之间的细节信息
64x64 到 128x128 之间的细节信息
128x128 到 256x256 之间的细节信息