- FNV能快速hash大量数据并保持较小的冲突率。其高度分散的特性使其适用于hash一些非常相近的字符串,如URL,hostname,文件名,text,IP地址等
- 最终生成的hash有限制:
- hash是无符号整型
- hash的位数(bits),应该是2的n次方(32,64,128,256,512,1024),一般32位的就够用了。
- 算法:
"""
提前设置一些相关变量:
hash:一个n位的无符号整型hash值
prime:FNV用于散列的质数
octet_of_data:8位数据(即一个字节)
"""
FNV-1描述:
hash = offset_basis
for each octet_of_data to be hashed
hash = hash * FNV_prime
hash = hash xor octet_of_data
return hash
FNV-1a描述:
hash = offset_basis
for each octet_of_data to be hashed
hash = hash xor octet_of_data
hash = hash * FNV_prime
return hash
- FNV-1a和FNV-1的唯一区别就是xor和multiply的顺序不同,他们所采用的FNV_prime和offset_basis都相同,有人认为FNV-1a在进行小数据(小于4个字节)哈希时有更好的性能。
- for each octet_of_data to be hashed 是对于要算哈希值的数,它的每一个字节。
- hash = hash * FNV_prime,是包含取模运算的,具体看采用多少位的哈希函数。例如,用32为哈希,hash = hash * FNV_prime % (2的32次方);
- hash = hash xor octet_of_data,意思是把当前取来的字节和当前的hash值的第八位做异或运算。