论文SK-LSH相关参考

NN-search

LSH

sk-LSH

(1)LSH:局部敏感HASH具有保距性,能高概率的将距离接近的数据映射为相同的hash值

改进的LSH方案:LSB,C2LSH,最近的是SortingKeys-LSH(Design by刘英帆),方案的思想是:

1)定义组合hash值间距离的度量规则

2)创建一个基于组合Hash值得顺序关系

3)依据上一步的顺序关系对数据点进行排序

4)彼此接近的数据点会被存到同一个索引文件中,这样可以减少检索时要访问的索引文件数量

SK-LSH的问题在于索引文件是本地存储,所以需要改进到支持云存储,即数据外包。

【方案设计】

(1)数据排序:采用SK-LSH局部敏感hash

1)组合hash值:对数据集中的一个数据点p(如一个视频K),它的组合hash值是:K=G§=(k1,k2,…,ki)=(hash1§,hash2§,…,hashi§);一组hash函数。

2)K的前L个元素称为k的(长度为L的)前缀,pref(K,L)

3)两个数据点p1,p2对应各自的组合hash值K1,K2,它们的L长前缀相等,他们的L+1长前缀不等,那么K1、K2的非前缀长度为:KL(K1,K2)=m-L

4)K1和K2的第L+1个元素间的距离被定义为:KD(K1,K2)=|k(1,l+1)-k(2,l+1)|

5)两个组合hash值得距离:dist(K1,K2)=KL(m-L)+KD(K1,K2)/C(C是一个标准因子)

6)对K1、K2等数据集中的所有点K按照上面规则排序

结论:if Ki

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值