最近在看E2LSH进行图像搜索查询,总结一下
E2LSH(exact Euclidean lsh)
LSH (Locality Sensitive Hashing)是当前高维空间中近似近邻搜索方法。它的关键思想是使用一些哈希函数,确保距离比较近的点比距离比较远的点冲突的概率大,当要查询的时候,只需查询与查询点q冲突的点,从而减少了距离计算,加快查询时间。
一般的LSH是比较得到的哈希值的海明距离,但是一般距离都是用欧式距离进行度量的,将欧式距离映射到海明空间再比较其的海明距离比较麻烦。
E2LSH是基于p-稳定分布的位置敏感哈希算法,可以直接处理二次欧拉距离。
关于p稳定分布,定义如下(这个p还需要理解一下)
定义:对于一个实数集R上的分布D,如果存在P>=0,对任何n个实数v1,…,vn和n个满足D分布的变量X1,…,Xn,随机变量ΣiviXi和(Σi|vi|p)1/pX有相同的分布,其中X是服从D分布的一个随机变量,则称D为 一个p-稳定分布。比如p=1是柯西分布,p=2时是高斯分布。一种分布模型吧。
一般提取出来的特征时高维的,