一个好的散列函数一般要考虑以下两个因素:
1、计算简便,以便提高转换速度
2、关键词对应的地址空间分布均匀,以尽量减少冲突
散列函数的常用方法
关键词为数字
1、直接定址法
取关键词的某个线性线性函数作为散列地址,即h(key)=axkey+b,比如统计1949年成立以来的司令身份,h(key)=key-1949.
2、除留余数法:
h(key)=key mod p
一般p=tablesize=素数 以使对象分布均匀
3、数字分析法
分析关键字的各个位,取比较随机的位来考虑散列地址,比如取手机号的后4位
4、折叠法
把关键词分割成相同的几个部分,然后相加
比如:123456地址取12+34+56
5、平方取中法
把关键词平方后,取中间的几位。
关键词为字符串
算法1、如果是a3、b2、c1就冲突,冲突严重。
算法2、冲突还是比较严重。
算法3、涉及到关键词的每一位、分布均匀。
算法3详细分析和实现:
比如:”abcd”
h(“abcd”)=’a’x32^3+’b’x32^2+’c’x32^1+’d’
我们可以对式子变形以减少乘法次数
((‘a’x32+’b’)x32+c)x32+’d’
并且乘以32可以看成左移5位
((‘a’<<5+’b’)<<5+’c’)<<5+’d’
postion hash(const char key[],int tablesize){
unsigned int h=0;
while(*key!='\0')
h=h<<5+*key++;
return h%tablesize;
}