一. 图像金字塔概述
1. 图像金字塔是图像中多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。
2. 图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。
3. 金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。如下图:
二. 图像金字塔种类:
高斯金字塔(Gaussianpyramid): 用来向下采样,主要的图像金字塔。
拉普拉斯金字塔(Laplacianpyramid): 用来从金字塔低层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行较大程度的还原,配合高斯金字塔一起使用。
这里的向下与向上采样,是对图像的尺寸而言的(和金字塔的方向相反),向上就是图像尺寸加倍,向下就是图像尺寸减半。而如果我们按上图中演示的金字塔方向来理解,金字塔向上图像其实在缩小,这样刚好是反过来了。
如下图所示:
三. 工作原理
高斯金字塔工作原理:
为了获取层级为i+1层的高斯金字塔图像,我们采用如下方法:
<1>对图像i进行高斯内核卷积
<2>将所有偶数行和列去除