阅读《RobHess的SIFT源码分析:综述》笔记

今天总算是机缘巧合的找到了照样一篇纲要性质的文章。

如是能早一些找到就好了。不过“在你认为为时已晚的时候,其实还为时未晚”倒是也能聊以自慰,不过不能经常这样迷惑自己,毕竟我需要开始跑了!

就照着这个大纲往下走走,说不定会有意想不到的收获,然后把多视点的问题加进去,或许应该能有所成效。

嗯,其他的太多的东西想来也无用。

我觉得现在比较重要的事情是,顺着这样一篇文章继续我要做的东西。

原文《RobHess的SIFT源码分析:综述》地址:

http://blog.csdn.net/masibuaa/article/details/9191309

文章首先给出建议看一下stitcher,发现之前就已经阅读过了:

本博之前简单解析过:http://www.cnblogs.com/letben/p/5338443.html,的确未有很大意义。

拼接样例前面也已经介绍过了。

然后发现一个回环【我终于想起来,为什么要写日志了。因为碰到断点不知道怎么处理了】

图像拼接及源码下载参见此篇博文:基于sift特征的全景图像拼接

在SIFT特征提取的时候要调用RobHess源码,参见《RobHess的SIFT源码分析:综述》

嗯,还没有看

http://blog.csdn.net/masibuaa/article/details/9246493

这个里面的详细内容,不过应该十分有益处。照着读一遍,跑一遍,应该是下限。

 

所以在它的基于sift特征的全景图拼接,应该就是一个最小集合吧。或许他翻源码比较细致。应该还有很多其他的内容的。也就是说,这篇只是一个代码,需要通过读代码,把里面的思想抽取出来,记录一下。

//TODO

 

然后断点回来先不看代码。

 

回到综述:

http://blog.csdn.net/masibuaa/article/details/9191309大概明白了这个robhess应该是个人名。

然后直到http://robwhess.github.io/opensift/ 再到:https://github.com/robwhess/opensift/zipball/master

发现应该是在给他上面共享了自己代码的同学,所以猜测masikkk应该是错写了robwhess的名字。博主也是能力巨大,硬生生给 罗伯维斯 起了个新的英文名字。。。

 

简单写一下

http://robwhess.github.io/opensift/

这个里面说的东西,不知怎么的,现在无论是看中文还是英文总是什么都记不住了,老了吧,还是懒了吧。。。或许是长期迷茫导致的不能学习综合征。

所以还是翻译一下吧:大概也算是自己真的读了这样一篇文章:

 

尺度不变特征转化(SIFT)是一个用来检测独特稳定图像特征的方法,它可以很轻松的进行图片之间的检测从而进行诸如物体检测识别或者计算图像之间的物理转换的任务。这个开源sift库是可到达的。它由使用C语言的opencv开源计算机视觉库和包括图片之间的sift特征的计算,以及使用kd树进行sift特征的匹配和从特征中使用随机抽样一致方法来计算集合图片的转换构成。这个库也包括功能导入并且他在图片上的特征的工作来源于David Lowe的sift的可行【executable】和牛津【VGG】仿射协变特征检测。http://www.cs.ubc.ca/~lowe/keypoints/下面的图片描述了这样一个功能。

第一幅图:单单只从两幅图片之间检测sift特征

第二幅图:再sift之后在经过随机抽样一直,得到的结果。【虽然还是有些不太符合的点,不过已经很好了】

依赖:

opencv的版本高于2.1

gtk+2 的版本高于2.9【然而并不知道什么是gtk,g什么工具包】

参考:

开源sift库 RHess ACM MM2010 【人名,大会名,年份?】

来自尺度不变关键点的独特图像特征

背景:

然后是专利通告。

 

所以我才要是想跑起来这个程序除了我们已经要配置好opencv以外,还有配置的有gtk。好在他们都是免费的。不过感觉配置gtk,,,好像要费点儿事儿,我滴妈呀。。。【不行已经读不下去了,果然,英语不是母语,看起来真的好费劲。。。】

 

下午跟老师 讨论了一下,说了一些内容

1、对于加权拼接,怎么做,我们会有很多sift点,但是其实我们只需要重合的一小部分,在速度上的问题。也就是我之前提到过的,对于我截取的桌面图的拼接。怎么做。

2、对于一段视频中的内容,比如视频内是关于车牌的信息,但是并不清楚,如果能从这些不清楚的汽车中提取出一个比较清楚的车牌信息,这个是否有办法做到,也就是说能否通过一系列单张模糊照片得到一个较为清晰的照片的这个事儿,老师给出的意见是:视频可以得到图像,图像根据第一章或者中间的某一张作为基准,无限贴合,看是否能得到一个比较好的结果。

 

现在的当务之急是:图像融合的部分,做这个加权,以及模糊得到清晰。

刚刚得到了一些比较重要的文献的连接:其实之前就看到过只是忘记了。。。

 

然后刚刚原来博客上就剩一个

一些SIFT算法和全景拼接测试用图下载,包含牛津大学网站上提供的测试图

 

然后是下面的正文部分。

 

看一下,再看一下基本融合。其实主要是一个基本算法,要是能自己实现一个拼接说实话,后面的很多研究都还是比较好做的。先到这儿吧

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
未使用包,python源码实现。 SIFT 尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种电脑视觉的算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。 其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。 此算法有其专利,专利拥有者为英属哥伦比亚大学。 局部影像特征的描述与侦测可以帮助辨识物体,SIFT 特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、些微视角改变的容忍度也相当高。基于这些特性,它们是高度显著而且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认。使用 SIFT特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的SIFT物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下,辨识速度可接近即时运算。SIFT特征的信息量大,适合在海量数据库中快速准确匹配。 SIFT算法的特点有: 1. SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性; 2. 独特性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配; 3. 多量性,即使少数的几个物体也可以产生大量的SIFT特征向量; 4. 高速性,经优化的SIFT匹配算法甚至可以达到实时的要求; 5. 可扩展性,可以很方便的与其他形式的特征向量进行联合。 SIFT算法可以解决的问题: 目标的自身状态、场景所处的环境和成像器材的成像特性等因素影响图像配准/目标识别跟踪的性能。而SIFT算法在一定程度上可解决: 1. 目标的旋转、缩放、平移(RST) 2. 图像仿射/投影变换(视点viewpoint) 3. 光照影响(illumination) 4. 目标遮挡(occlusion) 5. 杂物场景(clutter) 6. 噪声 SIFT算法的实质是在不同的尺度空间上查找关键点(特征点),并计算出关键点的方向。SIFT所查找到的关键点是一些十分突出,不会因光照,仿射变换和噪音等因素而变化的点,如角点、边缘点、暗区的亮点及亮区的暗点等。 Lowe将SIFT算法分解为如下四步: 1. 尺度空间极值检测:搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。 2. 关键点定位:在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。 3. 方向确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。 4. 关键点描述:在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。 本文沿着Lowe的步骤,参考Rob Hess及Andrea Vedaldi源码,详解SIFT算法的实现过程。 未使用包,python源码实现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值