高斯金字塔和拉普拉斯金字塔

最新推荐文章于 2024-03-13 18:27:15 发布

Pika在线

最新推荐文章于 2024-03-13 18:27:15 发布

阅读量1.6k

点赞数 1

分类专栏： AI视觉文章标签：拉普拉斯金字塔 opencv 放大频域

本文链接：https://blog.csdn.net/Ephemeroptera/article/details/90180697

版权

AI视觉专栏收录该内容

20 篇文章 0 订阅

订阅专栏

参考博客：https://blog.csdn.net/poem_qianmo/article/details/26157633

上采样方式：（1）近邻插值法，即复制扩张存在像素，其信息量不会增加，opencv实现:resize()

（2）高斯金字塔，即先近邻插值再高斯滤波，opencv实现：pyrUp（）

同理

下采样方式：（1）隔行取值，图像信息量会丢失，opencv实现:resize()

（2）高斯金字塔，即先滤波再隔行取值，opencv实现：pyrDown（）

需要注意到，上采样过程不会增加信息量，下采样过程会丢失信息量。拉普拉斯金字塔做法是：对于一个下采样的高斯金字塔，其信息量是不断减少的，为了获取丢失的信息量的大小，只需前后两级图片相减即可，考虑到图片大小不一致，故对较小图片pyrUp获取一致大小（信息量没有增加）再相减，即可获得信息差。将每一层信息差保存为拉普拉斯金字塔，当然拉普拉斯金字塔第一层为最小分辨率初始图片，有了各层的信息差，我们就可以复原任意级别的图片。在频域上，拉普拉斯金字塔可以理解为保存的是信号各频带信息，下面给出例子：

import cv2
import numpy as np
import math

# 定义生成拉普拉斯金字塔
def generate_laplacian_pyramid(img,lowest_res):
    # 最小分辨率
    lowest_level = int(math.log(lowest_res, 2))
    # 最大分辨率
    highest_res = img.shape[0]
    highest_level = int(math.log(highest_res,2))
    # 构建高斯金字塔
    G_PYD = []
    for level in range(highest_level,lowest_level-1,-1):
        if level==highest_level:
            G_PYD.append(img)
        else:
            img = cv2.pyrDown(img) # 下采样
            G_PYD.append(img)
    G_PYD = list(reversed(G_PYD)) # 逆置
    # # 构建拉普拉斯金字塔
    L_PYD = []
    L_PYD.append(G_PYD[0])
    for idx in range(1,len(G_PYD)):
        # 下采样+上采样，减少信息量
        dim = cv2.pyrDown(G_PYD[idx])
        dim = cv2.pyrUp(dim)
        # 获取指定频带信息
        L_PYD.append(abs(G_PYD[idx]-dim))

    return L_PYD

img = cv2.imread(r'./man.jpg')
img = cv2.resize(img,(256,256))
L = generate_laplacian_pyramid(img,32)
for each in L:
    cv2.imshow(' ',each)
    cv2.waitKey(0)