![95675a91aea9f35470260907aad9b660.png](https://i-blog.csdnimg.cn/blog_migrate/fdb512f3e3a08eb4d5eb4fa3021e4d13.png)
来源:李武军老师研究团队在2016年发表于国际人工智能联合会议(IJCAI 2016)。
摘要
近年来,我们目睹了哈希在大规模图像检索中的广泛应用。但是,大多数现有的散列方法都是基于手工制作的功能,这些功能可能无法与散列函数最佳兼容。近来,已经提出了深度哈希方法来利用深度神经网络同时执行特征学习和哈希码学习,与具有手工特征的传统哈希方法相比,深度哈希方法具有更好的性能。这些深度哈希方法中的大多数都受到监督,其监督信息由三元组标签给出。对于另一个使用成对标签的常见应用程序场景,还没有同时进行特征学习和哈希码学习的方法。在本文中,我们提出了一种新颖的深度哈希方法,称为深度成对监督哈希(DPSH),可以对具有成对标签的应用程序同时执行特征学习和哈希码学习。在真实数据集上的实验表明,我们的DPSH方法可以胜过其他方法,从而在图像检索应用程序中实现最新的性能。
1.介绍
随着诸如图像检索等实际应用中数据的爆炸性增长,近似最近邻(ANN)搜索成为近年来的热门研究课题。在现有的ANN技术中,由于其快速的查询速度和低内存要求,哈希已成为最流行和有效的技术之一。
现有的哈希方法可以分为与数据无关的方法和与数据相关的方法。在与数据无关的方法中,哈希函数通常是随机生成的,其独立于任何训练数据。代表性的与数据无关的方法包括局部敏感哈希(LSH)及其变体。依赖数据的方法尝试从一些训练数据中学习哈希函数,这也称为学习哈希(L2H)方法。与独立于数据的方法相比,L2H方法可以使用较短的哈希码实现相当或更高的准确性。因此,在实际应用中,与数据无关的方法相比,L2H方法已变得越来越流行。
L2H方法可以进一步分为两类:无监督方法和有监督方法。无监督方法仅使用数据点的特征(属性)信息,而在训练过程中不使用任何监督(标签)信息。代表性的无监督方法包括迭代量化(ITQ),各向同性哈希(IsoHash),离散图哈希(DGH)和可伸缩图哈希(SGH)。监督方法尝试利用监督(标签)信息来学习哈希码。可以三种不同的形式提供受监管的信息:逐点标签,成对标签和排名标签。代表性的基于逐点标签的方法包括CCA-ITQ,监督离散哈希(SDH)中的深度哈希方法。代表性的基于成对标签的方法包括用于散列的顺序投影学习(SPLH),最小损失散列,带监督的内核散列(KSH),两步哈希(TSH),快速监督哈希(FastH),潜在因子哈希(LFH),卷积神经网络哈希(CNNH),以及基于列采样的离散监督哈希(COSDISH)。代表性的基于排名标签的方法包括基于排名的监督哈希(RSH),列生成哈希(CGHash),顺序保留哈希(OPH,对保留哈希(RPH)进行排名,以及一些深度哈希方法。
尽管如上所述,已经提出了很多哈希方法,但是大多数现有的哈希方法,包括一些深度哈希方法都是基于手工特征。在这些方法中,手工制作的特征构造过程与哈希码和哈希函数学习过程无关,因此生成的特征可能与哈希过程不是最佳兼容。因此,这些现有的基于手工制作的特征的散列方法在实践中可能无法获得令人满意的性能。为了克服现有基于手工特征的方法的缺点,一些基于特征学习的深度哈希方法最近被提出使用深度神经网络同时执行特征学习和哈希码学习,与具有手工特征的传统哈希方法相比,它们表现出更好的性能。这些深度哈希方法中的大多数都是受监督的,其受监督信息由三元组标签给出,这是排序标签的特殊情况。
对于具有成对标签这一种常见应用场景,几乎没有基于特征学习的深度哈希方法。据我们所知,CNNH是唯一采用深度神经网络(deep neural network, CNN)对成对标签进行监督哈希的特征学习方法。CNNH是一种两阶段方法。在第一阶段,从成对标签中学习哈希码,然后第二阶段