大家好,这里是教授.F
引入:
所谓的线性探查法一个 key
发现算出来的 index
值已经被别的 key
占了,那么它就去 index + 1
的位置看看,如果还是被占了,就继续往后找,直到找到一个空的位置为止。
哈希表的设计跟拉链法一样。
难点:
1.我们需要将数组进行环形化处理。
如果数组后半部分已经没有空位置了,那我们需要从头开始遍历。
2.删除元素的操作
对于数组,删除和插入都要维护元素的连续性。所以要动态的维护数组。
我们不能直接将table[1]的位置设为null。这样我们就破坏了哈希表
方法一:数据搬移避免空洞
在 table
中删除元素时,可以进行类似数组的数据搬移操作,把后面的元素往前挪,保证元素的连续性。
但这里的搬移操作其实比数组的搬移操作更复杂,因为你不能把 table[1]
后面的全部元素往前挪,而应该仅挪动在索引 0 出现哈希冲突的元素。
举例来说,你如果移动后面的所有元素,table
就会变成这样:
table = [a, c, A, B, d, e, _, _, _, _]
index 0 1 2 3 4 5 6 7 8 9
hash ^ ^
key 0 20 3 13 30 40
看到问题了么?key = 3, value = A
的那个键值对你还能找到么?不能,hash(3) = 3
,顺着 table[3]
往后一直找都找不到,因为它被错误地往前移动了。
正确的做法是,只把在 hash(key) = 0
出现哈希冲突的元素往前挪,其他元素要不动,这样才能保证线性探查的正确性。
也就是说,删除 key = 10
之后,table
应该变成这样:
table = [a, c, d, A, B, e, _, _, _, _]
index 0 1 2 3 4 5 6 7 8 9
hash ^ ^
key 0 20 30 3 13 40
这样一来,获取每个 key
对应的 value
就不会出错了。
方法二:占位符标记删除
还有一种方法,就是通过一个特殊值作为占位符来标记被删元素,这样就可以避免数据搬移,同时保证元素连续。
还是这个例子:
table = [a, b, c, A, B, d, e, _, _, _]
index 0 1 2 3 4 5 6 7 8 9
hash ^ ^
key 0 10 20 3 13 30 40
如果你想删除 key = 10
,那么你可以把 table[1]
设置为一个特殊占位符标记为删除,我用 x
来表示,这样 table
就变成了:
table = [a, x, c, A, B, d, e, _, _, _]
index 0 1 2 3 4 5 6 7 8 9
hash ^ ^
key 0 20 3 13 30 40
在 get
方法中会特殊处理这个特殊值,所以你调用 get(10)
的时候会返回 -1
,表示没有找到。
同时,你调用 get(20), get(30), get(40)
的时候,还是可以正确地向后找到对应的 value
。
这种方法的好处是,不需要进行数据搬移,删除操作处理起来比较简单。
但也有缺点,比如如果你不断地插入和删除元素,table
数组中会出现很多这样占位符,这样会增加连续元素的长度,进而降低 get
方法线性探查的效率。
而且还有一种特殊情况,比如你不断插入和删除元素,导致 table
中全部都是占位符。如果你不对这种情况进行特殊处理,那么此时你调用一次 get
方法,由于环形数组的特性,算法就会陷入死循环。