论文SK-LSH相关参考

最新推荐文章于 2022-04-21 10:54:09 发布

Elylicery

最新推荐文章于 2022-04-21 10:54:09 发布

阅读量634

点赞数

分类专栏：读论文文章标签： ANN LSH

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_38368658/article/details/87019109

版权

读论文专栏收录该内容

1 篇文章 0 订阅

订阅专栏

NN-search

最近邻检索（Nearest Neighbor Search）的简单综述
https://blog.csdn.net/lovego123/article/details/67638789

LSH

关于c-ANN https://blog.csdn.net/qq_26304333/article/details/70486035
LSH(Locality Sensitive Hashing)原理与实现 https://blog.csdn.net/guoziqing506/article/details/53019049
数据相似性的度量方法总结 https://blog.csdn.net/guoziqing506/article/details/51779536
【E2LSH源码分析】p稳定分布LSH算法初探 https://blog.csdn.net/jasonding1354/article/details/38237353
Locality Sensitive Hashing ( LSH，局部敏感哈希 ) 详解(转) http://blog.sina.com.cn/s/blog_4ff49c7e0102vl52.html

sk-LSH

（1）LSH：局部敏感HASH具有保距性，能高概率的将距离接近的数据映射为相同的hash值

改进的LSH方案：LSB,C2LSH,最近的是SortingKeys-LSH（Design by刘英帆），方案的思想是：

1）定义组合hash值间距离的度量规则

2）创建一个基于组合Hash值得顺序关系

3）依据上一步的顺序关系对数据点进行排序

4）彼此接近的数据点会被存到同一个索引文件中，这样可以减少检索时要访问的索引文件数量

SK-LSH的问题在于索引文件是本地存储，所以需要改进到支持云存储，即数据外包。

【方案设计】

（1）数据排序：采用SK-LSH局部敏感hash

1）组合hash值：对数据集中的一个数据点p（如一个视频K），它的组合hash值是：K=G§=(k1,k2,…,ki)=(hash1§,hash2§,…,hashi§)；一组hash函数。

2）K的前L个元素称为k的（长度为L的）前缀，pref(K,L)

3）两个数据点p1,p2对应各自的组合hash值K1,K2，它们的L长前缀相等，他们的L+1长前缀不等，那么K1、K2的非前缀长度为：KL(K1，K2)=m-L

4）K1和K2的第L+1个元素间的距离被定义为：KD(K1,K2)=|k(1,l+1)-k(2,l+1)|

5）两个组合hash值得距离：dist(K1,K2)=KL(m-L)+KD(K1,K2)/C（C是一个标准因子）

6）对K1、K2等数据集中的所有点K按照上面规则排序

结论：if Ki

高维数据密文检索论文阅读 https://cloud.tencent.com/developer/news/224995

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
论文SK-LSH相关参考

SK-LSH最近邻检索（Nearest Neighbor Search）的简单综述https://blog.csdn.net/lovego123/article/details/67638789LSH解决c-ANN问题关于c-ANN https://blog.csdn.net/qq_26304333/article/details/70486035LSH(Locality Sensi...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。