《DEEP INDEX-COMPATIBLE HASHING FOR FAST IMAGE RETRIEVAL》阅读笔记

Abstract

To accelerate the subsequent Hamming ranking process, the multi-index approach

has been proposed to reduce the computations for the Hamming distance.

为了加速汉明距离排序过程,引入了多段索引方法减少汉明距离的计算量。建立了多段索引后,可以直接根据每一段的索引查询图片,这减少了“中间图片”的数目,进而缩小了查询时间。另外,可以根据多段索引的结果取并集(不取重)统计返回图片数目,直接按照该数目排序即可得到最相似的图片。然而,目前很多主流哈希方法并不适合使用多段索引的方法,因为不相似图片的哈希码也可能有多段重复(例如CSQ方法,某个哈希类中心可能有一半的段和另一个哈希类中心一样)。因此本文提出了适合多段索引的DICH方法并提出了block-based ranking strategy(段排序)方法进行图片查询。

Introduction

最近邻算法(NN)被广泛应用于检索当中,基于最近邻算法排序的哈希学习也在检索相似图片的应用中更加广泛。在哈希发展的过程中,有着基于手工的传统哈希方法和基于DNN的深度学习方法。尽管二值哈希码极大地减少了图片相似度的计算复杂度,大规模图片计算汉明距离并排序的过程仍然很耗时间。因此,多段索引及其变种方法被引入以加速汉明排序的过程。对于两组哈希码P和Q,将其分为b=q+1段,且P和Q的汉明距离小于等于q,则二者至少有一段匹配。(汉明距离小于等于q,意味着二者最多有q个bit不相同,假设每段长度为k,总长度为d=qk+k,则相同的bit个数至少为k+(k-1)q,如果有超过b个bit相同,则一定有一段匹配,所以列方程d/b=k+(k-1)q解得k= bq/(q+1)<b,得证)。对于小的q值(段数较少),因此每段长度较长,匹配难度增大,因此倾向于准确率检索。反之如果q的值比较大,多段索引方法每段都很短小,与不相似图片的匹配可能也会增大,也增大了哈希码生成的容错空间,因此这种方法提高检索的召回率。

然而深度哈希方法并没有很多将这种多段索引方法考虑在内,这些方法很可能出现不相似的图片也存在多段匹配的情况,因此如果使用多段索引方法检索图片会使得中间结果图片和候选图片都很多(这两类图片分别代表什么会在method部分说明)。

本文的模型结构如上图所示。因此本文的主要贡献分为以下几点:1)作者基于CNN提出了DICH方法,该方法能够在学习二进制哈希码的同时适用于多段索引方法。2)对于不相似的图片,作者提出index-compatible loss去最小化二者哈希码的匹配段数。在这种损失函数的约束下,中间结果集和候选图片的数量都减少,加速了汉明计算的过程。3)作者提出了block-based排序方法,这种方法可以跳过中间结果集和汉明距离的计算直接得到候选图片。4)实验部分证明了DICH方法在保证检索准确率的同时大大减少了检索的时间。

Method

1.Loss Function

基于上图可以发现,本文的创新点主要在index-compatible loss和block-based排序方法。

损失函数主要由三部分构成:

Q是量化损失,一般迫使哈希层的输出逼近于二值(正负1),取决于不同的哈希方法,这里不再详细分析。

该损失函数逐段约束了图片i和j间的汉明距离应当大于阈值。实际上,在本文实验的条件下,b=K/2,即每段只有2位哈希码,即每段只有00,01,10,11四种情况,即使使用做约束,也不能保证所有类别的哈希码都不存在相同的段数。

在实验部分,DICH1和DICH2的分别是DSH和DHN方法的损失函数,在加入后,不相似图片的匹配段数明显变少,相似图片也更倾向于匹配段数增多。

2.block-based ranking strategy

采用多段索引的方法对数据库中的哈希码进行检索时,先将query哈希码分段,取分段的结果在multi-index中索引,只要获得1段匹配,就把索引结果添加到中间结果集中,然后把中间结果集合并即可得到候选表,对候选表中的哈希码再与query哈希码计算汉明距离,这种方法可以减少汉明距离的计算次数,因为没有匹配段数的哈希码被多段索引滤掉不再计算。

而本文提出的基于索引块的排序方法更为快速。在中间结果集合并为候选表时,统计查询结果与query哈希码的匹配段数,匹配的段数越多越相似,省去了汉明距离的计算。因此,多段索引方法减少了候选图片数量从而缩短了查询时间,而block-based排序方法省去了汉明距离的计算减少了查询时间。

本文实验部分内容充分,尤其是对于内存数据库查询和磁盘I/O查询有着详细的分析,如果有兴趣可以阅读原文,这里不再赘述。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值