【零样本哈希】Zero-shot Hashing with orthogonal projection for image retrieval

本文提出一种正交投影方法应用于零样本哈希,旨在解决传统监督哈希方法对新类别数据处理的局限。通过将图像特征和类别词向量投影到正交哈希空间,确保不同类别间汉明距离相等,增强区分能力。实验表明,该方法在AWA、CIFAR-10和ImageNet数据集上表现优秀,尤其在长编码长度下,优于其他8种方法。
摘要由CSDN通过智能技术生成

Motivation

1、传统的监督哈希方法通常要求查询数据和训练数据具有相同的分布,这意味着查询数据的类别应该出现在训练类别中。然而,随着网络数据的爆炸式增长,新概念的图像正在迅速出现,为新出现的语义类别标记足够的训练数据是昂贵的,而且当新概念出现时对哈希函数进行重新训练是不现实的。Zero-shot Hashing可以对已知类别的样本进行训练,并迁移到到未知类别的测试数据上应用。

2、SitNet通过CNN提取图像特征,再结合center loss 和 max-margin loss的多任务结构来进行哈希学习,然而,在SitNet中,center loss 和 max-margin loss在扩大类间距离方面发挥着相似的作用。此外,由于哈希编码长度的限制,max-margin loss也存在一些问题,它可能使一些类别之间具有较大的距离,而另一些类别之间具有很小的距离,这往往导致区别能力不强。

Contributions

1 、提出了一种基于正交投影的方法来解决Zero-shot Hashing问题

2、 该方法将图像特征和类别词向量都投影到正交的哈希空间中,如果它们属于不同的类别,则要求它们彼此正交,否则相同。该约束可以保证不同类别的哈希编码具有相同的汉明距离(编码长度的一半)。正交约束优于max-margin loss,因为它可以在有限编码长度内生成区分能力更强的哈希编码,以减轻混淆。

3、利用深度学习强大的非线性拟合能力,将该方法推广到深度模型中,得到很大的改进。

Methods

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值