【E2LSH源码分析】LSH算法框架分析

本文介绍了位置敏感哈希(LSH)算法,用于高维数据的近似最近邻搜索。LSH通过哈希函数将高维向量映射到低维空间,相似的点有更大概率落入同一桶中。文章详细阐述了LSH的原理、(r1,r2,p1,p2)-敏感的LSH函数族定义,以及通用的LSH算法框架,包括构建LSH索引和搜索算法。通过对查询点进行哈希操作,可以快速找到候选近似最近邻点,提高查询效率。" 107801724,3179287,物理内存与虚拟内存的概念解析,"['操作系统', '内存管理', '编程']
摘要由CSDN通过智能技术生成

位置敏感哈希(Locality Sensitive Hashing,LSH)是近似最近邻搜索算法中最流行的一种,它有坚实的理论依据并且在高维数据空间中表现优异。由于网络上相关知识的介绍比较单一,现就LSH的相关算法和技术做一介绍总结,希望能给感兴趣的朋友提供便利,也希望有兴趣的同道中人多交流、多指正。


1、LSH原理

最近邻问题(nearest neighbor problem)可以定义如下:给定n个对象的集合并建立一个数据结构,当给定任意的要查询对象时,该数据结构返回针对查询对象的最相似的数据集对象。LSH的基本思想是利用多个哈希函数把高维空间中的向量映射到低维空间,利用低维空间的编码来表示高维向量。通过对向量对象进行多次哈希映射,高维向量按照其分布以及自身的特性落入不同哈希表的不同桶中。在理想情况下可以认为在高维空间中位置比较接近的向量对象有很大的概率最终落入同一个桶中,而

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值