1、哈希表定义
哈希表:根据设定的哈希函数*H(key)*和处理冲突的方法将一组关键字映像到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“像”作为记录在表中的存储位置。
哈希造表(散列):映像过程。
哈希地址(散列地址):所得存储位置。
2、哈希函数的构造方法
“好”的哈希函数:对于一个关键字集合中的任意一个关键字,经哈希函数映像到地址集合中任何一个地址的概率是相等的,则称此类哈希函数为均匀的哈希函数。(随机的地址)
选择哈希函数应该考虑的因素:
- 计算哈希函数所需时间;
- 关键字的长度;
- 哈希表的大小;
- 关键字的分布情况;
- 记录的查找频率;
常用方法:
-
直接定址法
H(key)=key或H(key)=akey+b*,其中a,b为常数。 -
数字分析法
哈希表中可能出现的关键字都是事先知道的,则可取关键字若干位数组成哈希地址。 -
平方取中法
取关键字平方后的中间几位为哈希地址。 -
折叠法
将关键字分割成位数相同的几部分(最后一部分的位数可以不同),然后取这几部分的叠加和(舍去进位)作为哈希地址。 -
除留余数法
取关键字被某个不大于哈希表表长m的数p除后所得余数为哈希地址。H(key)=key MOD p,p<=m;
经验:一般情况下,可以选p为质数或不包含小于20的质因数的合数。 -
随机数法
选择一个随机函数,取关键字的随机函数值为它的哈希地址,H(key)=random(key)
3、处理冲突的方法
-
开放定址法
Hi=(H(key)+di) MOD m, i=1,2,3,…,k(k<=m-1)
di为增量序列,有三种取法:
di=1,2,3,…,m-1 线性探测再散列;
di=12, -12,22,…二次探测再散列;
di=伪随机数序列,随机探测再散列; -
再哈希法
Hi=RHi(key) -
链地址法
-
建立一个公共溢出区