Locality-Sensitive Hashing (LSH)
在处理多媒体数据时,我们经常遇到高维数据,动则几十维上百维。如何快速索引和查找这些高维数据呢?LSH是一个不错的选择。
LSH基于的想法是比较简单的:如果两个点距离比较近,那么经过投影生成的两个点的距离会以较高的概率比较接近。这里我们设v是查询的点,x是投影向量(从高斯分布中随机采样而来),b为随机向量,w为量化步长,h为哈希的结果,我们有以下公式:
h = floor((x . v + b)
原创
2012-08-16 19:48:27 ·
927 阅读 ·
0 评论