图像检索其基本定义为给定的一个包含个图像数据集,每个图像可以用一个维的特征向量来描述,因此整个图像数据集就映射为维空间的个点,在此维空间中用一个相似度度量函数来测量两个图像点之间的距离,对于任意给定的查询点,需要设计一个数据结构,来快速的返回距离最近(Nearest Neighbor)的图像点(或者Ranking的多个点)。
当较小时(10-20),可采用如的结构,但当较大时(一个Discriminative的图像描述向量通常成百上千甚至万维),其查询时间将随指数级增长,这就是通常所说的维数灾难"the curse of dimensionality", 同时较大时,其所需的存储空间也变的intolerable。因此降维和Approximation NN算法通常会用到当前的检索系统中,ANN搜索就是对于给定的查询点,若数据集中存在点 距其小于距离 ,允许系统返回点 ,where,则称为搜索。
当前图像检索要求快、准、同时可容易的扩展至大规模数据web-scale:
Fast:hashing structure,small code, ANN;
Accurate: discriminative feature fingerprint;
Scalable: very little memroy.
由此可见,紧凑的fingerprint和有效的hash结构对整个检索系统至关重要,目前的图像检索系统中,常采用Hashing技术将高维的图像特征编码为低维的特征,在映射后的 空间中采用一定的距离度量进行Approximation Nearest Neighbors (ANN)搜索:
定义Hash函数集:, 是原始的 维特征空间, 是经hash函数集 散列后的 维空间,根据哈希函数设计的不同,可将Ha