由于计算机视觉中常常有关于图像金字塔的内容,所以学习了冈萨雷斯数字图像处理书中写的图像金字塔一节。
一、问题:
在看书的过程中对刚出现的两个概念不是很理解:1.分辨率近似 2.预测残差
我的理解:
1.分辨率近似:分辨率近似这个词很奇怪为什么要加近似两个词。书中讲到低分辨率近似,为什么要用近似两个词而不是直接用低分辨率呢?在我看来可能是为了不太绝对把。最后把近似两个词去掉我觉得反而更好理解,不用去纠结什么近似。
2.预测残差:讲到预测残差又会牵扯出两个关键词:a. 上采样 b. 预测图像。
a. 预测图像即是上采样得到的图像(书本上总是会涉及一些很专业的名词让人很纠结)。
b. 上采样(upsampling)简单的理解就是图像放大,并且是放大两倍,至于用何种差值算法由特点情况决定。既然有上采样那么就有降采样(downsampling),降采样简单理解就是图像缩小,并且是缩小两倍。
回到预测残差,预测残差=(原图->降采样->上采样)- 原图,简单来说就是原图经过缩小再放大之后再与原图做差计算。
那么不同分辨率的预测残差图像(图像和图像相减还是图像)排列成金字塔形状即为残差金字塔。
上采样:
降采样:
二、图像金字塔
再回到最原始的问题中,图像经过连续的降采样(这里是图像的像素大小降低一半)得到的图像一层层从小到大排列形成金字塔的形状,就形成了图像金字塔。如果在图像降采样(即图像缩小)的过程中不进行滤波那么得到的金字塔为取样金字塔,如果进行滤波(先滤波再降采样)又可以有领域滤波得到平均金字塔,高斯滤波得到高斯金字塔等等。
图像金字塔:
创建图像金字塔与残差金字塔的结构:
如果单单输出为的化则是图像金字塔,输出的是残差金字塔