什么是hash表
根据设定的哈希函数H(key)和处理冲突的方法将一组关键字映像到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“像”作为记录在表中的存储位置,这种表便称为哈希表,这一映像过程称为哈希造表或者散列,所得的存储位置称哈希地址或散列地址。
什么是Hash哈希碰撞(也叫“冲突”)
对应不同的关键字可能获得相同的hash地址,即 key1 ≠ key2,但是H(key1) = H(key2)。
这种现象就是冲突,而且这种冲突只能尽可能的减少,不能完全避免。为什么不能完全避免?
因为哈希函数是从关键字集合和地址集合的映像,通常关键字集合为无限大、长度不受限制(密码、或者文件都可以作为关键字),而地址集合确有限,无限量 映射到 有限量 上肯定是存在重合的部分,这就是冲突。
你想啊,200个男的匹配100个女的,那肯定是存在冲突的啊,保不准哪两个就打起来了。
1 开放地址法(再散列法)
开放地执法有一个公式:Hi=(H(key)+di) MOD m i=1,2,…,k(k<=m-1)
其中,m为哈希表的表长;di 是产生冲突的时候的增量序列。
- 如果di值可能为1,2,3,…m-1,称线性探测再散列。
- 如果di取1,则每次冲突之后,向后移动1个位置.如果di取值可能为1,-1,2,-2,4,-4,9,-9,16,-16,…kk,-kk(k<=m/2),称二次探测再散列。
- 如果di取值可能为伪随机数列。称伪随机探测再散列。
2 再哈希法Rehash
当发生冲突时,使用第二个、第三个、哈希函数计算地址,直到无冲突时。
这种方法是同时构造多个不同的哈希函数:
Hi=RH1(key) i=1,2,…,k
当哈希地址Hi=RH1(key)发生冲突时,再计算Hi=RH2(key)……,直到冲突不再产生。
这种方法不易

最低0.47元/天 解锁文章
962

被折叠的 条评论
为什么被折叠?



