LSH forest了解

最新推荐文章于 2023-03-03 14:52:34 发布

omywa

最新推荐文章于 2023-03-03 14:52:34 发布

阅读量2.1k

点赞数 1

LSH forest要解决的问题是，使用较少的存储空间，建立较高效的索引。

LSH forest逻辑结构描述：
从H集合中随机选取km（变量）个哈希函数，组成一个hash序列，则一个点p被映射为g(p，x) = (h1(p)， h2(p)，.......， hx(p))，称为点p的的 label，长度为x 。

对所有label构造前缀树（LSH Tree），每个叶子节点对应一个点；由l 个这样的树构成LSH forest。举例如下：

接下来看LSH forest的增删查操作过程：
（1）查询
自顶向下阶段：从某棵树的根节点开始，寻找与q 的label 最长前缀匹配的叶节点；

自底向上阶段：根据上一阶段的结果，对forest中的所有的树进行自底向上搜索，最后返回M个点，排序后就可以选择点q的m-NN了。

（2）插入插入一点q采用上述自顶向下的方式。若插入点与树中的点冲突，则需要对这两点的label进行延长一定的位数，确保label不同。

（3）删除也是采用自顶向下，按照label找到点删除即可。（原文中的意思是，删除完了再来一遍自底向下来压缩树中其它点的label么……）

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。