这一篇主要对图像哈希技术的现有算法做一个研究性的概述。由于哈希函数的本质是一个降维的操作,因此会存在特征信息的丢失和检索准确率的下降。
目前的哈希函数可以分为数据依赖的(Data-dependent)和数据独立的(Data-independent),数据依赖的哈希函数也就是依赖原始数据来学习哈希函数,数据独立的就是人工指定哈希函数。
最最经典的也算作最原始的用于图像检索的哈希算法是LSH,即局部敏感哈希(Locality Sensitivehashing)。它是由Piotr Indyk等人提出的,该方法对数据进行随机映射,属于数据独立的哈希函数。容易实现,计算速度也较快。这是一种非数据驱动型的算法,检索精度并不高。
之后的很多哈希函数都是基于该LSH方法做出的改进和扩展延伸,如Jianqiu Ji等人提出的超比特局部敏感哈希(Super-BitLocality-Sensitive Hashing, SBLSH),以角度作为核函数度量标准,对随机投影向量进行分组正交化;Brian Kulis等人提出的核化局部敏感哈希(KernelizedLocality-Sensitive Hashing, KLSH),对LSH进行了扩展,利用核函数和图像库中的稀疏集来构造随机映射,可以选择任意核函数作为相似性度量函数。
对于除了数据本身所具有的信息,数据可能还具有附加的信息,例如标签信息等,在模式识别、计算机视觉和机器学习等领域有着非常重要的作用。因此基于此,哈希函数还可以分为基于监督的、基于半监督的和基于非监督的哈希函数。
这里对近几年来的哈希函数做了一些总结和概述,整理在一个文档中。是根据袁勇学长的一篇博客进行整理的,