SIFT特征检测

Lowe提出的SIFT(Scale Invariant Feature Transform)是计算机视觉里影响力非常大的一个算法,其使用LOG的近似算法DOG(Difference of Gaussians)实现快速特征检测,然后对待选点进行位置的精调和筛选,最后考察其邻域,获得特征的矢量性描述。

SIFT特征效率高(优化后能达到实时的效果),具有尺度不变性旋转不变性部分的仿射不变性


1. 理论

总的来说,SIFT主要分为以下4个步骤[1]:

(1)尺度空间极值检测:搜索所有尺度上的图像位置。通过高斯微分函数(近似)来识别潜在的对于尺度和旋转不变的兴趣点。

(2)关键点的定位:在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。

(3)方向的确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。

(4)关键点描述:在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。


尺度空间极值检测

出发点与LOG一样,为了使特征具有尺度不变性。

SIFT首先建立图像金字塔:将金字塔分成O组,每一组称为一个Octave;每一个Octave又分成S层,每层的图像是由不同方差的高斯滤波器滤波的结果(越往上图像越模糊);每一个Octave的底层图像由上一个Octave的第S层图像高宽下2采样得到(缩小1/4);然后对高斯塔相邻两层做差得到DOG响应金字塔(是对LOG的近似)


图1-1. 图像金字塔

如图1-1,由图片大小决定Octave的数目(Rob Hess代码默认当图片缩小到4个像素则停止),每Octave的层数设为3-5层(代码默认3);对于第 i 个(i=1...)Octave的第 n 层(n=1...S)图片,其对应的高斯尺度为

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值