指使相近的数据有相近的hash值。
stable distribution
方法很数学。给出整数而非01
ssdeep
长度不一定。
tokens: context triggered; hash: FNV hash; 不知道怎么合成signature。
simhash
tokens:自己定义;hash:自己定义;按位均值生成signature。
sdhash
tokens: 滑窗 + 筛选出statistically improbable features;hash:SHA-1;按位与合成signature(Bloom Filter)。
tlsh
tokens:滑窗;hash:Pearson hash;bucket+四分位数生成signature。
mvhash
tokens:滑窗压缩+RLE+mod2+滑窗;滑窗结果放入BloomFilter合成signature。
minhash
方法很巧妙(很数学),但hash值是相对的。用于计算 Jaccard 相似度。
pehash
计算 portable executable 文件的 hash。
imphash
计算 portable executable 文件的 hash。