原始LSH算法trick

最新推荐文章于 2023-12-05 01:13:45 发布

库里没投过三分

最新推荐文章于 2023-12-05 01:13:45 发布

阅读量1.4k

点赞数

分类专栏：算法特征检索文章标签：特征检索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaonin/article/details/50595311

版权

　　原始LSH算法算法原理是将特征逐维映转成01串，之后进行hash（随机选bit），将空间中中相近的点hash到同一个桶；这样在查询中，只在同一个桶内暴力搜索即可，相较于在整个数据库中暴力查找，无疑减少了两两比较的次数，减少检索时间。
　算法实现中，如果真的逐维把特征值展开成01串，对于高维特征（维度几千），那么这个展开的“串”将特别的长，例如4000维特征，特征类型uchar，那么其转换成的串的长度为：255**4000，既占用存储空间，又浪费时间。原论文中提到了一个trick来避免转成“串”的这个过程，下面我试着解释一下这个trick。
　　假设特征为[4,2,5],特征最大值为5，那么将特征逐维度展开后的01“串”为：
　　　　　　　　　这里写图片描述

　　假设hash函数随机选取的bit位为：[2,3,6,8,10],那么提取出来的value为11101，这是展开成“串”的做法，下面我们换一种思路。
　　提取出的bit位 bits=[2,3,6,8,10]实质上分别作用于原始特征[4,2,5]的某一维：bits0 =[2,3]提取第一维（4）展开的串，bits1=[6,8]提取第二维（2）站看的串，bits2=[10]提取第三维（5）展开的串，提取出对应的bit值后

最低0.47元/天解锁文章

库里没投过三分

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
原始LSH算法trick

原始LSH算法算法原理是将特征逐维映转成01串，之后进行hash（随机选bit），将空间中中相近的点hash到同一个桶；这样在查询中，只在同一个桶内暴力搜索即可，相较于在整个数据库中暴力查找，无疑减少了两两比较的次数，减少检索时间。算法实现中，如果真的逐维把特征值展开成01串，对于高维特征（维度几千），那么这个展开的“串”将特别的长，例如4000维特征，特征类型uchar，那么其转
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。