OpenCV SIFT源码详解——图像预处理
一、图像预处理函数
预处理函数定义在sift.dispatch.cpp文件中,是SIFT_Imp
的成员。声明如下:
static Mat createInitialImage( const Mat& img, bool doubleImageSize, float sigma );
1.img:输入影像
2.doubleImageSize:是否将图像扩大两倍
3.sigma :初始图像尺度,一般为1.6
二、函数定义关键处注释
static Mat createInitialImage( const Mat& img, bool doubleImageSize, float sigma )
{
CV_TRACE_FUNCTION();
Mat gray, gray_fpt;
/*
* 将图像转换为单通道,且元素类型为float
* sift_wt:typedef float sift_wt;
*
* 便于后序极值点定位以及描述符计算
*/
if( img.channels() == 3 || img.channels() == 4 )
{
cvtColor(img, gray, COLOR_BGR2GRAY);
gray.convertTo(gray_fpt, DataType<sift_wt>::type, SIFT_FIXPT_SCALE, 0);
}
else
img.convertTo(gray_fpt, DataType<sift_wt>::type, SIFT_FIXPT_SCALE, 0);
float sig_diff;
if( doubleImageSize )
{
/*
* 若图像扩大两倍后
* 高斯金字塔初始图像需要做 sigma = 1.6 的滤波
* 相机已经对图像做了 0.5*2 的高斯滤波
* 所以还需要 为 图像做
* sqrtf(sigma* sigma - 2 * 0.5 * 2 * 0,5)的滤波
* SIFT_INIT_SIGMA:0.5
* 因为sigma是用户传入参数,虽默认值是1.6,但是可以被用户更改
* 为防止最终的结果值过小,所以下式和0.01做了比较,取最大值
*/
sig_diff = sqrtf( std::max(sigma * sigma - SIFT_INIT_SIGMA * SIFT_INIT_SIGMA * 4, 0.01f) );
Mat dbl;
/*
* 图像扩大两倍
*/
#if DoG_TYPE_SHORT
resize(gray_fpt, dbl, Size(gray_fpt.cols*2, gray_fpt.rows*2), 0, 0, INTER_LINEAR_EXACT);
#else
resize(gray_fpt, dbl, Size(gray_fpt.cols*2, gray_fpt.rows*2), 0, 0, INTER_LINEAR);
#endif
Mat result;
//高斯平滑
GaussianBlur(dbl, result, Size(), sig_diff, sig_diff);
return result;
}
else
{
/*
* 若图像无需扩大两倍,则相机对图像做了sigma=0.5的滤波
*/
sig_diff = sqrtf( std::max(sigma * sigma - SIFT_INIT_SIGMA * SIFT_INIT_SIGMA, 0.01f) );
Mat result;
GaussianBlur(gray_fpt, result, Size(), sig_diff, sig_diff);
return result;
}
}
三、关键点总结
- 该函数传入原始图像,返回经过sigma = 1.6滤波处理后的图像。后序会以该图像为基础,构建高斯金字塔;
- Lowe推荐初始尺度sigma=1.6,该参数值可以更改。通过SIFT::create构造对象时传入自定义值即可。