Locality Sensitive Hashing
https://sanzo.top/Algorithm/Locality-Sensitive-Hashing/试想你有一些文本它们可能有所重复,你需要对他们进行去重处理,传统的做法是O(N2)O(N^2)O(N2),即对所有的文本对进行相似度的计算,然后进行排序得到结果。假设N=106N=10^6N=106,需要进行N(N−1)2=5×1011\frac{N(N-1)}{2} = 5\times10^{11}2N(N−1)=5×1011次计算,在果每秒计算10610^6106次,一天大概10510^5
原创
2021-10-01 19:36:29 ·
290 阅读 ·
0 评论