在一般的线性表,树等存储结构中,每个记录的存储位置是随机的,若数据量过大,则查找过程中的逐个比较很是个问题,因此就提出了很多快速查找的方法,其中一个就是 hash 。
hash 表通过一定的映射,使记录的关键字与其存储位置建立联系,
但是这种映射,有可能会出现多个关键字对应同一个存储位置的问题,即哈希函数产生相同的地址。
处理地址冲突的方法:
1 、开放定址法
Hi=(H(key)+di) MOD m i=1,2,...,k(k<=m-1) 其中 m 为表长, di 为增量序列 , 如果 di 值可能为 1,2,3,...m-1 ,称线性探测再散列。 如果 di 取值可能为 1,-1,2,-2,4,-4,9,-9,16,-16,...k*k,-k*k(k<=m/2), 称二次探测再散列。
如果 di 取值可能为伪随机数列。称伪随机探测再散列。
2、再哈希法
当发生冲突时,使用第二个、第三个、哈希函数计算地址,直到无冲突时。缺点:计算时间增加。
3、链地址法
将所有关键字为同义词的记录存储在同一线性链表中。
4、建立一个公共溢出区
假设哈希函数的值域为 [0,m-1], 则设向量 HashTable[0..m-1] 为基本表,另外设立存储空间向量 OverTable[0..v] 用以存储发生冲突的记录。
……