经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门书籍《OpenCV 4开发详解》。为了更让小伙伴更早的了解最新版的OpenCV 4,小白与出版社沟通,提前在公众号上连载部分内容,请持续关注小白。 |
图像金字塔是通过多个分辨率表示图像的一种有效且简单的结构。一个图像金字塔是一系列以金字塔形状排列,分辨率逐步降低的图像集合。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的表示。本节中将介绍图像金字塔中最著名的两种——高斯金字塔和拉普拉斯金字塔。
高斯金字塔
构建图像的高斯金字塔是解决尺度不确定性的一种常用方法。高斯金字塔是指通过下采样不断的将图像的尺寸缩小,进而在金字塔中包含多个尺度的图像,高斯金字塔的形式如图3-30所示,一般情况下,高斯金字塔的最底层为图像的原图,每上一层就会通过下采样缩小一次图像的尺寸,通常情况尺寸会缩小为原来的一半,但是如果有特殊需求,缩小的尺寸也可以根据实际情况进行调整。由于每次图像的尺寸都缩小为原来的一半,图像尺缩小的速度非常快,因此常见高斯金字塔的层数为3到6层。OpenCV 4中提供了pyrDown()函数专门用于图像的下采样计算,便于构建图像的高斯金字塔,该函数的函数原型在代码清单3-51中给出。
代码清单3-51 pyrDown()函数原型
1. void cv::pyrDown(InputArray src,
2. OutputArray dst,
3. const Size & dstsize = Size(),
4. int borderType = BORDER_DEFAULT
5. )
- src:输入待下采样的图像。
- dst:输出下采样后的图像,图像尺寸可以指定,但是数据类型和通道数与src相同,
- dstsize:输出图像尺寸,可以缺省。
- borderType:像素边界外推方法的标志,取值范围如表3-5所示
该函数用于实现图像模糊并对其进行下采样,默认状态下函数输出的图像的尺寸为输入图像尺寸的一半,但是也可以通过dstsize参数来设置输出图像的大小,需要注意的是无论输出尺寸为多少都应满足式(3.15)中的条件。该函数首先将原图像与内核矩阵进行卷积,内核矩阵如式(3.16)所示,之后通过不使用偶数行和列的方式对图像进行下采样,最终实现尺寸缩小的下采样图像。
{ ∣ d s t s i z e . w i d t h ∗ 2 − s r c . c o l s ∣ ≤ 2 ∣ d s t s i z e . h e i g h t ∗ 2 − s r c . r o w s ∣ ≤ 2 (3.15) \left\{ \begin{array}{l} \left| {
{\rm{dstsize}}{\rm{.width}}*2 - {\rm{src}}{\rm{.cols}}} \right| \le 2\\ \left| {
{\rm{dstsize}}{\rm{.height}}*2 - {\rm{src}}{\rm{.rows}}} \right| \le 2 \end{array} \right. \tag{3.15} {
∣dstsize.width∗2−