Surf特征提取分析

Surf特征提取分析

读“H.Bay, T. Tuytelaars, L. V. Gool, SURF:Speed Up Robust Features[J],ECCV,2006”笔记

SURF:Speed Up Robust Features,加速鲁棒特征。

我觉得SURF是SIFT特征的一种近似计算,在相似性能甚至更好性能的同时提高了算法的速度。这些近似体现在

  • 在尺度空间中,使用box filtes与原图像卷积,而不是使用DoG算子

  • 确定关键点方向时,Surf是利用不同方向bin中的haar小波响应的最大值最为方向,而Sift是统计周围区域像素点的方向直方图,找出最大方向bin作为主方向,而且还可以有多个方向。

  • 特征描述子,Surf在关键点周围取1027162-20160924173041809-1192472776.png区域分成44块小区域,在每个小区域计算采样点的haar响应,统计对应的四个特征1027162-20160924173043215-917138418.png,共64维特征,而Sift在周围1616的区域划分成4*4的子区域,每一个子区域提取长度为8的方向直方图特征,排列起来形成128维特征向量。

为什么速度会提升呢?这里要明白一点,DoG算子分开两步其实是先高斯平滑再差分。

  • 使用box filters相对于高斯滤波,再辅助以积分图速度肯定提升不少。

  • Hessian矩阵的计算一般而言还是挺麻烦的,但这里可以使用积分图计算,无论尺度是多少都可以使用几个数的加减完成,速度很快。

  • 确定关键点方向时使用haar特征同样可以利用积分图,简单快速。

  • 特征描述子使用64维取代128维特征降低了后续处理的数据规模

接下来就来一步步分析surf特征吧

Fast-Hessian Detector 尺度空间生成

这一步其实相当于LoG算子。
在LoG中首先使用高斯平滑,然后对平滑后的图形进行Laplace获得二阶梯度特征。
而Fast-Hessian Detector则是首先使用box filter滤波,然后使用Hessian矩阵表征二阶梯度。

高斯二阶梯度到近似的二阶梯度算子如下图

enter description here

1474701327495.jpg

从左到右分别表示在y方向LoG算子(1027162-20160924173047746-798240476.png),xy方向的LoG算子1027162-20160924173049121-1650310306.png,y方向近似的LoG算子1027162-20160924173054059-1584122210.png,xy方向近似的LoG算子1027162-20160924173057027-2054283825.png

Hessian矩阵能够刻画二维曲面上点的不同方向变化剧烈程度,这里可以参见角点检测,只有当Hessian矩阵的两个特征值均远大于0时才认为该点是角点。行列式是特征值的乘积。
Hessian矩阵的计算

1027162-20160924173058465-382660973.png

那么使用上图的类似算子,就可以表示成

1027162-20160924173101012-1643076275.png

但是近似毕竟是近似,这里近似一点,那里近似一点,累积的方差就大了,所以在计算hessian矩阵行列式时进行了修正

1027162-20160924173104418-730403295.png

1.2是LoG的尺度,9是box filter的边长,自己可以算一算
于是

1027162-20160924173106090-1502656839.png

其中D是近似的Hessian矩阵。

这个式子是怎么来的呢?很难理解对不对,我们来推一推,目的是要1027162-20160924173107231-104008080.png
1027162-20160924173109402-1177098423.png,于是

1027162-20160924173111106-698457655.png

是不是发现问题了,在上面算0.9时我们1027162-20160924173114402-1536620032.png替换成1027162-20160924173118621-654206114.png时仍然成立,所以就得到了计算行列式的近似式。

论文中指出surf初始size是1027162-20160924173121137-1859282448.png,这么大区域平滑的效果等同于尺度为1027162-20160924173122606-1376592346.png的高斯平滑。
同样的surf中也会建塔,但是和sift不同的是,sift在尺度增大的同时,不断对图像下采样,而surf在建塔的时候每层图像大小不变,只是对模板的尺度不断增大,相当于一个上采样的过程。

enter description here

1474704408299.jpg

论文中第一塔中size分别为1027162-20160924173126215-1357105376.png,而以后每塔中size边长差距逐塔翻倍。
如下图

enter description here

1474705392249.jpg

size大小和对应LoG尺度可以如下换算1027162-20160924173130746-313081496.png

尺度空间生成之后就开始进行定位关键点了。

关键点定位

这里和LoG,DoG相同,都是在生成尺度空间后,找在三维上找极值点。

enter description here

1474706156407.jpg

这里和DoG不同的是不用剔除边缘导致的极值点了,因为Hessian矩阵的行列式就已经考虑到边缘的问题了,而DoG计算只是把不同方向变化趋势给出来,后续还需要使用Hessian矩阵的特征值剔除边缘产生的影响。

在定位关键点时,要使用3维线性插值的方法得到亚像素级的坐标位置。

Scale space interpolation is especially important in our case, as the difference in scale between the first layers of every octave is relatively large.

这样关键点也找到了,下一步为了旋转不变性就该确定关键点方向了

关键点方向

不像sift中依靠梯度方向直方图确定主方向,Surf首先将周围`!$6s$的圆形区域分成6个扇形区间,s是对应的尺度,和size的换算方法,上文给出了。然后在每个扇形区域使用提取x方向和y方向的Haar小波特征(Haar小波的边长为4s),将该区域每个样本点这两个响应的高斯加权和作为该区域的方向,最后扫面了整个圆形区域,选择最大方向就是该关键点的方向。

enter description here

使用的haar小波算子.jpg

enter description here

分区域统计方向.jpg

ok,接下来就该描述关键点了

surf特征描述子

和sift类似,这时候为了保持旋转不变性,当然要将关键点的方向旋转一致之后再统计特征。

统计特征时,再该关键点周围选取1027162-20160924173138449-2133731575.png的区域,划分成1027162-20160924173139668-827108163.png的子区域,在每个子区域内使用x方向,y方向的的haar小波特征算子提取haar小波特征,然后使用提取结果统计1027162-20160924173143137-739230827.png四个值作为该子区域的特征,那么一个关键点就可以使用16个子区域的特征联合表示,即64维向量。

子区域特征提取

子区域特征提取.jpg

部分实验结果

关键点检测

enter description here

1474708745838.jpg

匹配结果图,这两幅图中相似的要素其实蛮多的,这使匹配的效果并不理想

enter description here

1474708128266.jpg

图像的配准

enter description here

1474708804017.jpg

enter description here

1474708821848.jpg


参考文献
1. tornadomeet,特征点检测学习_2(surf算法),博客园,2012,8
2. Speeded up robust features(wiki百科)

转载于:https://www.cnblogs.com/YiXiaoZhou/p/5903690.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值