作者在本文中指出了现在面向大规模图像检索中监督哈希学习中存在的两个主流问题:
(1)如此有效的采用监督信息进行语义相似学习;(现阶段pair-wise和triplet)
(2)如何进行bianry code的离散优化;(现阶段sign或者sigmoid等激活函数)
摘要
现在的深度哈希检索中损失函数的优化都是基于pair-wise或者triplet形式的排序学习,然后这样的方式不但代价高而且缺乏充分的语义信息。针对上述问题,本文主要直接采用类标签信息来进行深度度量学习,具体来说就是在Gaussian分布基础上构建cubic constraint loss,该损失可以保持语义比变化而且可以对不同标签的重叠部分进行惩罚;此外,为了解决深度哈希中的离散化优化问题,采用了two-step优化策略来进行训练。当训练样本受限制时,算法性能表现非常优秀。
本文的主要工作
针对上述两个主流问题,本文直接采用类标签进行语义相似度学习,同时对于不同类标签中的重叠部分进行了惩罚。本文的思想主要是采用数据类别层面的信息来进行深度哈希学习——Deep Class-Wise Hashing (DCWH),并扩展到了多标签数据集中。另一方面,与之前工作离散化优化不同的是,本文采用一种two-step优化的方法。
作者在介绍本文的主要思想时,首先分析了深度监督哈希和深度度量学习;其次,详细分析了pair-wise和triplet 损失的优缺点。通过之前的工作,作者发现是否可以通过增加更多的图像pairs来提高性能,一种极端情况就是,对于给定的anchor image,所有与之相似或者不相似的图像都用来进行计算。即有如下定义:
其中,是与anchor image
所有的相似图像,