摘要
当数据label可用时,采深度网络来学习binary code,同时来表示图像深度表示特征。与其他基于pair-wise的方法不一样,该方法采用point-wise的思想。实验表明该方法在CIFAR-10 和 MNIST是state-of-the-art。同时在1百万张衣服图片的大规模数据集中验证该方法的可扩展性和有效性。
本文的思路和主要工作
有些基于pair-wise的方法通常使用相似度矩阵来描述图像对或者数据对之间的关系(主要指的是CNNH和CNNH+),并采用这些相似信息来学习hash function。当处理大规模数据集时,要构建矩阵和产生hash code。本文从监督学习出发,同时学习图像表示和binary code,与其他方法不同的是(基于pair-wise的CNNH和CNNH+),本文的方法是基于point-wise的思想,利用incremental learning nature(SGD),适用于大规模图像检索。本文的主要工作包括如下四点:
(1)介绍了适用于快速图像检索的一种有效而简单监督学习框架;
(2)基于网络模型的稍微改动 finetune,同时学习图像特征表示和hashing-like function;
(3)该方法在CIFAR-10 和 MNIST是state-of-the-art;
(4)相比于其他conventional pair-wised approaches,本文方法中基于point-wised的思想学习到hashing code在数据规模方面具有很好的可扩展性。
本文方法DL