这个问题是从HashMap引申出来的,遇到Hash冲突问题,该如何解决?
什么是Hash冲突?
设定 : 有一个空的数组
入参 : 一个key值,一个value值
操作 : 调用hash()方法, 计算出key的hash值,将hash值作为下标,在数组对应位置写入value值
冲突 : 如果两个不同的key计算出来的hash值相同,可是同一个下标只能存放一个value值,这样就产生了冲突
由于数组是容量是有限的,但是可以存入多个key,这样难免就会遇到hash冲突问题
解决Hash冲突主要有三种方法:
- 开放地址法
- 再散列法
- 拉链法(链地址法)
开放地址法
核心思想:如果当前位置发生了Hash冲突,就在数据里找寻其他没有冲突的位置存放这个数据
简单地说,就是如果当前数组位置已经有数据了,就去看看它下一个位置是否是空的,如果是,就可以插入啦,如果不是,就需要继续访问在下一个位置,直到找到空的位置. 可以将数组想成一个循环数组,找到最后一位后,从第一位再继续开始,也就是说,如果当前位置为 i, 数组大小是m, 那么
查找范围是:
开放地址法在具体找寻下一个节点计算上根据di的取值方式,又有多种方法实现
1⃣️线性探测法
如上文所诉就是线性探测法, 如果当前下标i已经有数据了(发生冲突了), 就去访问相邻的下一个位置,即i+1这个位置是否是空的,如果有数据,再访问i+2, 直到找到空的位置, 或者循环一圈发现无法找到空位置,这时候表明数组已经被存满了, 需要进行数组的扩容操作
这个方法会产生 聚集 问题:
当很多个key计算出的都是一个hash值,那么根据这个规则, 数组里将会有连续很长一段位置都存放了数据,这就产生了 聚集 , 这时新进来一个key, 同样也是这个hash值的时候,就需要从当前位置逐个遍历到聚集的末尾才能插入,当哈希表越来越满时聚集越来越严重,这导致产生非常长的探测长度,后续的数据插入将会非常费时。通常数据超过三分之二满时性能下降严重,因此设计哈希表关键确保不会超过这个数据容量的一半,最多不超过三分之二
2⃣️平方探测法
d i =