Motivation
1、传统的监督哈希方法通常要求查询数据和训练数据具有相同的分布,这意味着查询数据的类别应该出现在训练类别中。然而,随着网络数据的爆炸式增长,新概念的图像正在迅速出现,为新出现的语义类别标记足够的训练数据是昂贵的,而且当新概念出现时对哈希函数进行重新训练是不现实的。Zero-shot Hashing可以对已知类别的样本进行训练,并迁移到到未知类别的测试数据上应用。
2、SitNet通过CNN提取图像特征,再结合center loss 和 max-margin loss的多任务结构来进行哈希学习,然而,在SitNet中,center loss 和 max-margin loss在扩大类间距离方面发挥着相似的作用。此外,由于哈希编码长度的限制,max-margin loss也存在一些问题,它可能使一些类别之间具有较大的距离,而另一些类别之间具有很小的距离,这往往导致区别能力不强。
Contributions
1 、提出了一种基于正交投影的方法来解决Zero-shot Hashing问题
2、 该方法将图像特征和类别词向量都投影到正交的哈希空间中,如果它们属于不同的类别,则要求它们彼此正交,否则相同。该约束可以保证不同类别的哈希编码具有相同的汉明距离(编码长度的一半)。正交约束优于max-margin loss,因为它可以在有限编码长度内生成区分能力更强的哈希编码,以减轻混淆。
3、利用深度学习强大的非线性拟合能力,将该方法推广到深度模型中,得到很大的改进。
Methods