参看论文:Liu H, Wang R, Shan S, et al. Deep Supervised Hashing for Fast Image Retrieval[C]. computer vision and pattern recognition, 2016: 2064-2072.
会议水平:CVPR2016
供稿单位:中科院计算所 (中科院计算所、自动化所都是做图像处理的神一样的单位,各种CVPR、各种姿势)
1.导读
自从孪生网络又被大家捡起来哪一天(2014),就注定了和匹配相关领域的不平静,无论是图像检索、立体匹配还是基于最佳匹配的跟踪,孪生网络及其衍生分支网络正在一点点颠覆几乎所有的经典算法。由Haomiao Liu报道的深度监督哈希算法短短一年多就收获了134的引用量,大部分的相关工作都是在该基础之上开展的,所以很有必要研究。
Hash,就是把任意长度的输入通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
2. 摘要及目标
为了在大数据上开发高效的图像检索算法,作者提出了一种新的Hashing方法用于学习图像紧密的二值编码。在图像检索领域,尽管图像的形貌变化带来非常大的挑战,但是利用CNN学习一个鲁棒性的图像表达为解决这个挑战带来了曙光。这边文章就是利用CNN来学习高相似紧凑的二值编码形式,也就是原文作者提到的深度监督Hashing。特别的,作者设计了CNN结构,利用一对图像输入,输出判别分类。(现在看来似乎很简单,但放在16年,确实不容易)。作者精心设计了损失函数,用于最大化判别性能。
Our goal is to learn compact binary codes for imagessuch that: (a) similar images should be encoded to similar binary codes in Hamming space, and vice versa; (b) the binary codes could be computed efficiently。
Our method first trains the CNN using image pair