C语言实现寻找极值点,九之再续：教你一步一步用c语言实现sift算法、上

最新推荐文章于 2023-12-27 00:09:13 发布

黄先森先森

最新推荐文章于 2023-12-27 00:09:13 发布

阅读量1k

点赞数

文章标签： C语言实现寻找极值点

教你一步一步用c语言实现sift算法、上

作者：July、二零一一年三月十二日

出处：http://blog.csdn.net/v_JULY_v

参考：Rob Hess维护的sift 库

环境：windows xp+vc6.0

条件：c语言实现。

说明：本BLOG内会陆续一一实现所有经典算法。

------------------------

引言：在我写的关于sift算法的前倆篇文章里头，已经对sift算法有了初步的介绍：九、图像特征提取与匹配之SIFT算法，而后在：九(续)、sift算法的编译与实现里，我也简单记录下了如何利用opencv，gsl等库编译运行sift程序。

但据一朋友表示，是否能用c语言实现sift算法，同时，尽量不用到opencv，gsl等第三方库之类的东西。而且，Rob Hess维护的sift 库，也不好懂，有的人根本搞不懂是怎么一回事。

那么本文，就教你如何利用c语言一步一步实现sift算法，同时，你也就能真正明白sift算法到底是怎么一回事了。

ok，先看一下，本程序最终运行的效果图，sift 算法分为五个步骤(下文详述)，对应以下第二--第六幅图：

sift算法的步骤要实现一个算法，首先要完全理解这个算法的原理或思想。咱们先来简单了解下，什么叫sift算法：

sift，尺度不变特征转换，是一种电脑视觉的算法用来侦测与描述影像中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量，此算法由 David Lowe 在1999年所发表，2004年完善总结。

所谓，Sift算法就是用不同尺度(标准差)的高斯函数对图像进行平滑，然后比较平滑后图像的差别，

差别大的像素就是特征明显的点。

以下是sift算法的五个步骤：

一、建立图像尺度空间(或高斯金字塔)，并检测极值点

首先建立尺度空间，要使得图像具有尺度空间不变形，就要建立尺度空间，sift算法采用了高斯函数来建立尺度空间，高斯函数公式为：

G(x,y,e) = [1/2*pi*e^2] * exp[ -(x^2 + y^2)/2e^2]

上述公式G(x,y,e)，即为尺度可变高斯函数。

而，一个图像的尺度空间L(x,y,e) ,定义为原始图像I(x,y)与上述的一个可变尺度的2维高斯函数G(x,y,e) 卷积运算。

即，原始影像I(x，y)在不同的尺度e下，与高斯函数G(x,y,e)进行卷积，得到L(x,y,e)，如下：

L(x,y,e) = G(x,y,e)*I(x,y)

以上的(x，y)是空间坐标， e，是尺度坐标，或尺度空间因子，e的大小决定平滑程度，大尺度对应图像的概貌特征，小尺度对应图像的细节特征。大的e值对应粗糙尺度(低分辨率)，反之，对应精细尺度(高分辨率)。

尺度，受e这个参数控制的表示。而不同的L(x,y,e)就构成了尺度空间，具体计算的时候，即使连续的高斯函数，都被离散为(一般为奇数大小)(2*k+1) *(2*k+1)矩阵，来和数字图像进行卷积运算。

随着e的变化，建立起不同的尺度空间，或称之为建立起图像的高斯金字塔。

但，像上述L(x,y,e) = G(x,y,e)*I(x,y)的操作，在进行高斯卷积时，整个图像就要遍历所有的像素进行卷积(边界点除外)，于此，就造成了时间和空间上的很大浪费。

为了更有效的在尺度空间检测到稳定的关键点，也为了缩小时间和空间复杂度，对上述的操作作了一个改建：即，提出了高斯差分尺度空间(DOG scale-space)。利用不同尺度的高斯差分与原始图像I(x,y)相乘，卷积生成。

D(x,y,e) = ((G(x,y,ke) - G(x,y,e)) * I(x,y)

= L(x,y,ke) - L(x,y,e) DOG算子计算简单，是尺度归一化的LOG算子的近似。

ok，耐心点，咱们再来总结一下上述内容：

1、高斯卷积

在组建一组尺度空间后，再组建下一组尺度空间，对上一组尺度空间的最后一幅图像进行二分之一采样，得到下一组尺度空间的第一幅图像，然后进行像建立第一组尺度空间那样的操作，得到第二组尺度空间，公式定义为

L(x,y,e) = G(x,y,e)*I(x,y)

图像金字塔的构建：图像金字塔共O组，每组有S层，下一组的图像由上一组图像降采样得到，效果图，图A如下(左为上一组，右为下一组)：

2、高斯差分

在尺度空间建立完毕后，为了能够找到稳定的关键点，采用高斯差分的方法来检测那些在局部位置的极值点，即采用俩个相邻的尺度中的图像相减，即公式定义为：

D(x,y,e) = ((G(x,y,ke) - G(x,y,e)) * I(x,y)

= L(x,y,ke) - L(x,y,e)

效果图，图B：

SIFT的精妙之处在于采用图像金字塔的方法解决这一问题，我们可以把两幅图像想象成是连续的，分别以它们作为底面作四棱锥，就像金字塔，那么每一个截面与原图像相似，那么两个金字塔中必然会有包含大小一致的物体的无穷个截面，但应用只能是离散的，所以我们只能构造有限层，层数越多当然越好，但处理时间会相应增加，层数太少不行，因为向下采样的截面中可能找不到尺寸大小一致的两个物体的图像。

咱们再来具体阐述下构造D(x,y,e)的详细步骤： 1、首先

最低0.47元/天解锁文章

黄先森先森

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
C语言实现寻找极值点,九之再续：教你一步一步用c语言实现sift算法、上

教你一步一步用c语言实现sift算法、上作者：July、二零一一年三月十二日出处：http://blog.csdn.net/v_JULY_v参考：Rob Hess维护的sift 库环境：windows xp+vc6.0条件：c语言实现。说明：本BLOG内会陆续一一实现所有经典算法。------------------------引言：在我写的关于sift算法的前倆篇文章里头，已经对sift...
复制链接

扫一扫