相似图检索小综述

相似图检索

20世纪70年代至20世纪90年代之间,解决图像检索的思路主要是TBIR。通过手动为数据库图像以及查询图像添加文本标签,使得图像检索问题降维成文本检索问题。其主要存在两个问题:

  1. 文本标签不能完全描述图像内容(一图值千字)
  2. 人工添加数据库图像标签的成本十分昂贵

进入20世纪90年代,为了克服基于标签的图像检索算法的上述两个缺点,提出了CBIR,利用图像中的视觉特征,如纹理、形状、颜色等进行检索。

图片检索算法的发展历程 CBIR(基于内容的图像检索)
基本流程
CBIR的基本流程
首先,在训练阶段,提取训练数据库图像的视觉特征,并利用提取的视觉特征计算图像的向量表示
其次,在查询阶段,提取查询图像的视觉特征并计算查询图像表示
然后利用查询图像与所有数据库图像的向量表示计算相似度
最后建立高效的索引方法进行排序,得到检索结果

研究发展
CBIR的研究发展
其核心步骤为
1. 视觉特征提取。重点在于设计信息量丰富,并且独特、可区分的视觉特征。
2. 包含相似度计算与索引排序的检索步骤。设计重点在于减少内存占用,提高检索速度,设计高效的检索算法。

后面会逐步介绍上述有关算法。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于内容的图像检索是指通过像本身的特征信息进行检索,而不是通过手工标注的标签或其他外部信息进行检索。其主要流程包括像特征提取、相似度计算和检索结果排序。 1. 像特征提取 像特征提取是基于内容的图像检索中最关键的一步。常用的像特征包括颜色直方、纹理特征、形状特征等。其中,颜色直方是最为常用的一种特征,它可以描述像的颜色分布情况。纹理特征可以描述像的纹理信息,如像的皱纹、条纹等。形状特征可以描述像的形状信息,如像的边缘、角点等。 2. 相似度计算 相似度计算是指计算两幅像之间的相似程度。常用的相似度计算方法包括欧几里得距离、余弦相似度、汉明距离等。其中,欧几里得距离是指两个向量之间的欧几里得距离,余弦相似度是指两个向量之间的夹角余弦值,汉明距离是指两个二进制向量之间不同位数的个数。 3. 检索结果排序 检索结果排序是指将检索到的像按照相似度进行排序,以便用户更快速地找到所需像。常用的排序方法包括基于特征加权的排序、基于相似度的排序等。 基于内容的图像检索技术已经得到广泛应用,如库管理、人脸识别、医学影像检索等。未来,随着技术的不断进步,基于内容的图像检索技术将会得到更广泛的应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值