这篇paper的主要思想其实很简单,主要是基于在将图像之间的相似度划分为完全相似、局部相似和不相似(与本人的一篇的paper想法类似),在此基础上,将完全相似和不相似的图像loss采用cross-entropy,局部相似的图像采用mean square error,从而设计出了损失函数。
摘要
作者指出在多标签图像检索中,现在的方法根据标签之间的相似度直接将图像划分为相似图像和不相似图像,其实除此之前还有局部相似图像,从而忽略了图像相似度的排序。针对这个问题,作者将重新定义了图像相似度,即instance similarity,同时将根据将相似度量为百分比。基于instance similarity,分别采用cross-entropy和mean square error构建了loss function。最后,通过在三个主要数据集上的实验表明了该算法的有效性。
本文的主要工作
作者详细分析了基于监督学习和无监督学习的深度哈希方法,同时指出了大部分的方法并没有考虑到多标签数据之间的相似度情况。具体来说,作者定义了量化的pairwise similarity,称之为instance similarity。基于instance similarity,提出了an instance similarity deep hashing method (ISDH) 来学习高质量的哈希编码;根据instance similarity 矩阵,通过引入cross-entropy 和最小化的mean square error 从而保持语义排序。下面将详细介绍一下本文的工作。
pairwise similarity 量化为百分比,相似度的值sij定义如下: