图像检索：CNN对Hash组算法的颠覆

最新推荐文章于 2024-04-14 09:54:52 发布

沈子恒

最新推荐文章于 2024-04-14 09:54:52 发布

阅读量6.4k

点赞数 1

本文链接：https://blog.csdn.net/shenziheng1/article/details/81360279

版权

本文提出了一种深度监督哈希（DSH）方法，使用CNN学习图像的紧凑二值编码，旨在解决图像检索中的相似性保持问题。通过设计损失函数和考虑形貌变化，DSH在CIFAR-10和NUS-WIDE等大型数据集上展现出优于当前最先进的性能。该方法首先利用图像对和相似性标签训练CNN，然后通过正则化实值输出以接近二值编码。

摘要由CSDN通过智能技术生成

参看论文：Liu H, Wang R, Shan S, et al. Deep Supervised Hashing for Fast Image Retrieval[C]. computer vision and pattern recognition, 2016: 2064-2072.

会议水平：CVPR2016

供稿单位：中科院计算所（中科院计算所、自动化所都是做图像处理的神一样的单位，各种CVPR、各种姿势）

1.导读

自从孪生网络又被大家捡起来哪一天（2014），就注定了和匹配相关领域的不平静，无论是图像检索、立体匹配还是基于最佳匹配的跟踪，孪生网络及其衍生分支网络正在一点点颠覆几乎所有的经典算法。由Haomiao Liu报道的深度监督哈希算法短短一年多就收获了134的引用量，大部分的相关工作都是在该基础之上开展的，所以很有必要研究。

Hash，就是把任意长度的输入通过散列算法变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

2. 摘要及目标

为了在大数据上开发高效的图像检索算法，作者提出了一种新的Hashing方法用于学习图像紧密的二值编码。在图像检索领域，尽管图像的形貌变化带来非常大的挑战，但是利用CNN学习一个鲁棒性的图像表达为解决这个挑战带来了曙光。这边文章就是利用CNN来学习高相似紧凑的二值编码形式，也就是原文作者提到的深度监督Hashing。特别的，作者设计了CNN结构，利用一对图像输入，输出判别分类。（现在看来似乎很简单，但放在16年，确实不容易）。作者精心设计了损失函数，用于最大化判别性能。

Our goal is to learn compact binary codes for imagessuch that: (a) similar images should be encoded to similar binary codes in Hamming space, and vice versa; (b) the binary codes could be computed efficiently。

Our method first trains the CNN using image pair