图像金字塔
原理
Note
以下内容来自于Bradski和Kaehler的大作: Learning OpenCV 。
- 当我们需要将图像转换到另一个尺寸的时候, 有两种可能:
- 放大 图像 或者
- 缩小 图像。
- 尽管OpenCV 几何变换 部分提供了一个真正意义上的图像缩放函数(resize, 在以后的教程中会学到),不过在本篇我们首先学习一下使用图像金字塔 来做图像缩放, 图像金字塔是视觉运用中广泛采用的一项技术。
图像金字塔
- 一个图像金字塔是一系列图像的集合 - 所有图像来源于同一张原始图像 - 通过梯次向下采样获得,直到达到某个终止条件才停止采样。
- 有两种类型的图像金字塔常常出现在文献和应用中:
- 高斯金字塔(Gaussian pyramid): 用来向下采样
- 拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像
- 在这篇文档中我们将使用 高斯金字塔 。
高斯金字塔
-
想想金字塔为一层一层的图像,层级越高,图像越小。
-
每一层都按从下到上的次序编号, 层级
(表示为
尺寸小于层级
(
))。
-
为了获取层级为
的金字塔图像,我们采用如下方法:
-
将
与高斯内核卷积:
-
将所有偶数行和列去除。
-
-
显而易见,结果图像只有原图的四分之一。通过对输入图像
(原始图像) 不停迭代以上步骤就会得到整个金字塔。
-
以上过程描述了对图像的向下采样,如果将图像变大呢?:
- 首先,将图像在每个方向扩大为原来的两倍,新增的行和列以0填充(
)
- 使用先前同样的内核(乘以4)与放大后的图像卷积,获得 “新增像素” 的近似值。
- 首先,将图像在每个方向扩大为原来的两倍,新增的行和列以0填充(
-
这两个步骤(向下和向上采样) 分别通过OpenCV函数 pyrUp 和 pyrDown 实现, 我们将会在下面的示例中演示如何使用这两个函数。
<pre name="code" class="objc">代码如下:
#include <highgui.h>
#include <cv.h>
#pragma comment(lib, "cv.lib")
#pragma comment(lib, "cxcore.lib")
#pragma comment(lib, "highgui.lib")
IplImage* doPyrDown( IplImage* src ); //上一级图像生成下一层图像
IplImage* doPyrUp( IplImage* src ); //将现有图像在两个维度上都放大两倍
int main()
{
IplImage* src = cvLoadImage( "1.jpg",1 );
IplImage* dst = NULL;
IplImage* dst2=NULL;
cvNamedWindow( "source", 1 );
cvShowImage( "source", src );
dst = doPyrDown( src );
cvNamedWindow( "PyrDown", 1 );
cvShowImage( "PyrDown", dst );
dst2 = doPyrUp( src );
cvNamedWindow( "PyrUp", 1 );
cvShowImage( "PyrUp", dst2 );
cvWaitKey(0);
cvReleaseImage( &dst );
cvReleaseImage( &dst2 );
cvReleaseImage( &src );
cvDestroyAllWindows();
return 0;
}
IplImage* doPyrDown( IplImage* src )
{
IplImage* result = cvCreateImage( cvSize( src -> width/2, src -> height/2 ), src -> depth, src -> nChannels );
//库函数调用cvPyrDown
cvPyrDown( src, result, CV_GAUSSIAN_5x5 ); //高斯变换
return result;
}
IplImage* doPyrUp( IplImage* src )
{
IplImage* result = cvCreateImage( cvSize( src -> width*2, src -> height*2 ), src -> depth, src -> nChannels );
cvPyrUp( src, result, CV_GAUSSIAN_5x5 );
return result;
}