最近需要大量用字符串做作为hashtable的key,但是对性能有比较强的要求,在网上搜罗了一番,下面是搜来的成果
摘:
我个人认为字符串HASH函数的好坏在于产生的HASH CODE的冲突的大小,比如,对100亿海量字符串进行HASH CODE的运算,平均冲突最小的HASH函数就是
最好的。而在性能方面,HASH函数的时间复杂度应该都是与字符串长度相关的,也就是O(N)
MurmurHash2的算法实现,在预先计算字符串长度的前提下,以整数类型计算HASH而不是char类型来计算,对于长字符串,HASH函数的性能提高应该还
是比较明显的