基于p稳定分布的LSH

E2LSH是一种位置敏感的哈希算法,利用p稳定分布处理高维向量,减少欧式距离计算,提高查询效率。通过随机向量a与特征向量的点乘投影,将向量映射到哈希值,近似计算点间距离。哈希函数包含随机变量a和b,选择多个函数增加冲突概率,形成多个哈希表。在数据库构建和检索过程中,通过不同的排列组合和额外的哈希函数降低存储需求。查询时,遍历所有桶并找到最近邻。
摘要由CSDN通过智能技术生成

最近在看E2LSH进行图像搜索查询,总结一下

E2LSH(exact Euclidean lsh)

LSH (Locality Sensitive Hashing)是当前高维空间中近似近邻搜索方法。

它的关键思想是使用一些哈希函数,确保距离比较近的点比距离比较远的点冲突的概率大,当要查询的时候,只需查询与查询点q冲突的点,从而减少了距离计算,加快查询时间。

一般的LSH是比较得到的哈希值的海明距离,但是一般距离都是用欧式距离进行度量的,将欧式距离映射到海明空间再比较其的海明距离比较麻烦。

E2LSH是基于p-稳定分布的位置敏感哈希算法,可以直接处理二次欧拉距离。

关于p稳定分布,定义如下(这个p还需要理解一下)

定义:对于一个实数集R上的分布D,如果存在P>=0,对任何n个实数v1,…,vn和n个满足D分布的变量X1,…,Xn,随机变量ΣiviXi和(Σi|vi|p)1/pX有相同的分布,其中X是服从D分布的一个随机变量,则称D为 一个p-稳定分布。比如p=1是柯西分布,p=2时是高斯分布。一种分布模型吧。

一般提取出来的特征时高维的,

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值