python 实现MinHash和MinHashLSH算法
最近实现了一把MinHash和MinHashLSH算法,发现实现的细节还是挺难的,所以我把datasketch的源代码改了一下,去除了很多冗余的代码,保留了算法的实现主要细节部分。MinHash算法:import hashlibimport numpy as npdef sha1_hash32(data): return struct.unpack('<I', hashlib.sha1(data).digest()[:4])[0]_mersenne_prime = (1 &l
原创
2020-08-23 12:06:47 ·
3497 阅读 ·
4 评论