nilsimsa是一种局部敏感哈希,在python中其实已经有库实现了。
但是搜了搜发现并没有使用文档,但是其实GitHub仓库中有一个test.py
文件,里面有一些对nilsimsa库基本功能的测试。从这里可以知道一些基本使用方法。
生成摘要
import nilsimsa
s="qwq"
nil_test=nilsimsa.Nilsimsa(s.encode())
out=nil_test.hexdigest()
对比摘要
compare_digests
返回-127到128之间的数字,128说明相同,-127说明非常不同。
from nilsimsa import Nilsimsa,compare_digests
def getHash(data:str)-> str:
nil=Nilsimsa(data.encode())
return nil.hexdigest()
s1="qwq"*19+"abb"
s2="qwq"*20
print(getHash(s1)+'\n'+getHash(s2))
print(compare_digests(getHash(s1),getHash(s2)))