基于SIFT及BOW的图像检索

本文探讨基于内容的图像检索技术,重点是SIFT特征提取和BOW模型。通过SIFT进行特征提取,利用K-Means构建视觉词典,然后将图像转化为单词频率直方图。接着,构建倒排索引并进行直方图匹配以实现图像检索。实验结果显示,直方图重排在大量匹配图像中能提高检索精准度。
摘要由CSDN通过智能技术生成

一、什么是图像检索

图像检索就是基于图像的某一特征对其他图片进行匹配检索。从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。在这里我们主要讨论的是基于内容的图像检索
BOW(bag of words)模型最初应用于文本处理领域,用来对文档进行分类和识别。

二、实现图像检索的步骤

1、 基于SIFT进行特征提取
在这一点,我在前面的笔记中有详细的介绍过如何进行基于sift算子的特征提取。将待处理的图片都进行SIFT特征提取处理,并且保存在原来存放图片的文件夹中,备用。
2、学习构建“视觉词典(visual vocabulary)”
对于已经提取的图像特征进行遍历,并利用聚类方法(本次实验使用K-Means算法)将其投影到词汇上,,特征描述子分为K个簇,以使簇内具有较高的相似度,而簇间相似度较低,将词义相近的词汇合并,作为单词表中的基础词汇,聚类类别的数量K即为整个视觉词典的大小基础词汇的个数。提交至数据库,由此产生该图片群的视觉词典。
3、针对输入特征集,根据视觉词典进行量化

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值