SIFT算法系列之尺度空间

尺度空间定义

  说到尺度空间理论最早可以追溯到1962年的T.Iijima最先提出,学术界开始关注尺度空间技术主要在1986年IEEE PAMI上同时刊出的4篇关于尺度空间理论的文章奠定了发展基础。现实世界中物体只有具备一定的尺度才能够倍人眼所察觉,计算机视觉学术研究就是在不断的尝试与突破来模拟人眼的观察方法。因此,尺度空间就是试图在图像领域中模拟人眼观察物体的概念与方法。例如:观察一颗树,关键在于我们想要观察是树叶子还是整棵树:如果是一整棵树(相当于大尺度情况下观察),那么就应该去除图像的细节部分。如果是树叶(小尺度情况下观察),那么就该观察局部细节特征。

  构建尺度空间的过程中,其实是在不断的去除细节过程同时不能够引进新的错误细节特征。想想尺度空间金字塔进行高斯滤波时候,原始图像保存最多的细节特征,经过高斯滤波后细节特征逐渐减少来模拟大尺度情况下的特征表示。那么,什么是尺度空间?能否给尺度空间技术有个数学上定义或者判断准则呢?示例参考于:

图1 第一组角
图2 第二组角
图3 第三组角
图4 第四组角
图5 第五组角
  从图1-5中示例来观察判断左右哪个角度更为尖锐问题。图1中可以清楚的判断出右边更为尖锐(左边圆钝),因为从数学概念上其角度值小。图2中可以判断右边的尖锐,因为从数学上其曲率值小。图3中判断哪个更为尖锐相对困难一些。右边的具有大的角度值(圆钝)又有较大的曲率值(尖锐),左边刚好相反。所以在图3中判断哪个角更为尖锐已经不在是纯粹的数学概念可以获取明确答案。准确的说,这是计算机视觉中的尺度空间理论的视觉问题,答案取决于观察物体所在的尺度而不是数学上的指标。图4表示在大尺度下观察(远距离),答案是左边的角尖锐。图5表示在小尺度下观察(近距离),答案结果是右边的角度比较尖锐。在这里:尺度空间可以被理解成为观察物体窗口的大小。

  尺度空间多为多尺度技术的分支和作为金字塔概念的延伸与发展,一般尺度的概念可以有以下几种表示

  1 以图像分辨率作为评判准则(图像在多分辨率情况下展示的物体)。

  2 人眼观察图像轮廓大小的标准。

  3 观察物体距离的远近作为判断标准。

  4 滤波卷积核参数作为判断标准。

  现实情况下物体距离观察者所处位置的远近而呈现出不同的表达,如人眼观察物体在不同的尺度下感受不同,距离较远时观察到的是主要轮廓区域,近距离下观察到更多的细节信息。大尺度参数情况下,高频信息丢失严重,主要显示大致轮廓信息,高频段细节被称作图像中显著的特征。高频信息在视觉领域易于发现与辨识,能够运用于进行特征提取、目标识别等任务。这就是不同尺度下所带来的效应。计算机视觉中的多尺度技术想要表达的基本思想是大尺度情况下图像模糊轮廓形状是小尺度情况下图像轮廓形状的采样。

尺度空间发展及其分类

  尺度空间能够很好的模拟人眼观察事物的情况,因此在计算机视觉领域中得到很好的应用。构建尺度空间方法主要分为两类:线性尺度空间与非线性尺度空间。其实线性与非线性尺度空间的主要区别在于滤波核函数的不同。线性尺度空间主要核函数是高斯核函数:其计算简单,高效。同时高斯核函数是唯一的尺度不变核函数尺度不变性论文。但是,高斯函数主要的缺点在于无法有效的分辩均匀区域与边缘区域,都是相同的滤波尺度,导致丢失大量局部细节。所以,针对高斯滤波的缺陷,非线性尺度空间理论被提出与应用。非线性滤波核函数当下主要有:双边滤波、非线性扩散滤波等。非线性滤波函数主要解决高斯滤波无法有效分辨均匀与边缘的判决,因此非线性滤波核函数能够保留更多的(高频)边缘信息同时滤波均匀区域。当然,非线性滤波核函数计算复杂度也随之提升。

SIFT尺度空间生成过程

  说到SIFT算法在构建尺度空间过程可以归纳为:不同大小的高斯核函数对图像进行卷积滤波同时在层级变换之间进行下采样来构建金字塔模式下的尺度空间。SIFT算法在构建尺度空间时候采取高斯核函数进行滤波,主要原因有两个:1 高斯核函数是唯一的尺度不变核函数。2 DoG核函数可以近似为LoG函数,这样可以使特征提取更加简单。同时,David. Lowe作者在论文中提出将原始图像进行2倍上采样后滤波能够保留更多的信息便于后续特征提取与匹配。其实尺度空间图像生成就是当前图像与不同尺度核参数 σ σ σ进行卷积运算后产生的图像。

那么下面就以图像方式表述一下尺度空间构建过程

图6 尺度空间示意图

  如上图6尺度空间金字塔构建过程示意图,分别为不同尺度下的卷积滤波后的图像迭代演化。其中 S S S代表每组中层数(即X方向产生卷积图像个数), O O O为金字塔的塔数(即Y方向图像的列数)。SIFT算法中构建高斯金字塔组数一般计算默认如下: O = [ l o g 2 ( m i n ( w , h ) ) ] − 3 O=[log_2(min(w,h))]-3 O=[log2(min(w,h))]3  其中 ( w , h ) (w,h) (w,h)分别表示图像的宽高。其中每组中的层数 S S S一般设置为3~5。二维高斯空间函数: G ( x i , y i
  • 33
    点赞
  • 95
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值