p-稳定E2LSH

本文介绍了E2LSH(Exact Euclidean Locality Sensitive Hashing)算法,这是一种基于p-稳定分布的降维方法,用于处理高维数据。E2LSH利用p-稳定分布的特性设计哈希函数,保持了数据点之间的距离关系,适用于近邻搜索。通过联合使用多个位置敏感函数和主、次哈希函数,E2LSH能够高效地聚类数据点并检索近邻。
摘要由CSDN通过智能技术生成


LSH算法的基本思想就是用随机的哈希函数值保证相似的数据点以很高的概率发生冲突而能够被检测到。最初的LSH应用在haming空间,后来将其扩展到欧氏空间。欧氏局部敏感哈希(E2LSH,Exact Euclidean locality sensitive Hashing)是位置LSH在欧氏空间的一种随机化实现方法,其基本原理是:利用基于p-稳定分布的位置敏感函数对高维数据进行降维映射,使原始空间中距离很近的两个点经映射操作后依然很近。E2LSH继承了原始LSH的两个特性:第一是它很适合于维数高但稀疏的数据点,如图像特征;第二是如果数据满足一定的有界增长特性,它就可以很快地找到精确的近邻。如下图所示,三维空间中很近的点(绿颜色圆球)投影到某个平面上它们的距离仍然很近,三维空间中距离很远的红色正方体投影到平面上距离仍然很远。




E2LSH是基于p-稳定分布的,它使用哈希函数将数据点投影到随机的方向矢量 a上,a的每个元素均服从p-稳定分布。具有如下性质:若两个变量都服从p-稳定分布,则其线性组合也服从p-稳定分布

 

p=1时是柯西分布, 概率密度函数为:



评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值