元素的存储位置与它的关键码之间有一个确定的对应函数关系Hash():
Address=Hash(key)
散列函数
构造散列函数要求:
- 散列函数的定义域必须包括需要存储的全部关键码
- 散列函数计算出来的地址应能均匀分布在整个地址空间中
- 散列函数应该简单
几种散列函数:
- 除留余数法:取最接近于或等于m的质数p作为除数。
- 数字分析法:求各位数字中符号分布的均匀度,越小分布的越均匀。取均匀的位作记录的散列地址。
- 平方取中法。一般取散列地址为8的某次幂。例如散列地址总数m=8^3,则内码取中间的3位做地址
- 折叠法:关键码自左向右分成位数相等的几部分,位数与散列地址位数相同(最后一部分可以短一些),进行叠加:移位法(把各部分的最后一位对齐相加)、分界法(沿各部分的分界来回折叠,然后对齐相加)
处理冲突的闭散列:
- 线性探查法:当冲突查看紧随其后的下一个桶。
- 二次探查法:寻找“下一个”空桶的公式:
Hi=(H0+i^2)%m
,Hi=(H0-i^2)%m
;i=1,2…(m-1)/2。 - 双散列:第一个Hash()按关键码key计算元素所在桶号,一旦冲突,利用第二个ReHash()计算该元素到达“下一个”桶的移位量。
处理冲突的开散列方法
通过散列函数将具有相同关键码的地址归在一个子集合中,每个子集合称为桶,子集合用一个单链表链接起来,各链表的表头结点组成一个向量,链表表头结点i是向量中的第i个元素。