线性探查法实现哈希表（理论篇）

教授.F

已于 2024-05-30 18:05:13 修改

阅读量852

点赞数 30

文章标签：散列表数据结构

于 2024-05-30 13:13:15 首次发布

本文链接：https://blog.csdn.net/fzyjiaoshou/article/details/138799069

版权

大家好，这里是教授.F

引入：

所谓的线性探查法一个 key 发现算出来的 index 值已经被别的 key 占了，那么它就去 index + 1 的位置看看，如果还是被占了，就继续往后找，直到找到一个空的位置为止。

哈希表的设计跟拉链法一样。

如果数组后半部分已经没有空位置了，那我们需要从头开始遍历。

对于数组，删除和插入都要维护元素的连续性。所以要动态的维护数组。

我们不能直接将table[1]的位置设为null。这样我们就破坏了哈希表

在 table 中删除元素时，可以进行类似数组的数据搬移操作，把后面的元素往前挪，保证元素的连续性。

但这里的搬移操作其实比数组的搬移操作更复杂，因为你不能把 table[1] 后面的全部元素往前挪，而应该仅挪动在索引 0 出现哈希冲突的元素。

举例来说，你如果移动后面的所有元素，table 就会变成这样：

table = [a, c, A, B, d, e, _, _, _, _]
index    0  1  2  3  4  5  6  7  8  9
hash     ^        ^
key      0 20  3 13  30 40

看到问题了么？key = 3, value = A 的那个键值对你还能找到么？不能，hash(3) = 3，顺着 table[3] 往后一直找都找不到，因为它被错误地往前移动了。

正确的做法是，只把在 hash(key) = 0 出现哈希冲突的元素往前挪，其他元素要不动，这样才能保证线性探查的正确性。

也就是说，删除 key = 10 之后，table 应该变成这样：

table = [a, c, d, A, B, e, _, _, _, _]
index    0  1  2  3  4  5  6  7  8  9
hash     ^        ^
key      0 20 30  3 13  40

这样一来，获取每个 key 对应的 value 就不会出错了。

还有一种方法，就是通过一个特殊值作为占位符来标记被删元素，这样就可以避免数据搬移，同时保证元素连续。

还是这个例子：

table = [a, b, c, A, B, d, e, _, _, _]
index    0  1  2  3  4  5  6  7  8  9
hash     ^        ^
key      0 10 20  3 13  30 40

如果你想删除 key = 10，那么你可以把 table[1] 设置为一个特殊占位符标记为删除，我用 x 来表示，这样 table 就变成了：

table = [a, x, c, A, B, d, e, _, _, _]
index    0  1  2  3  4  5  6  7  8  9
hash     ^        ^
key      0    20  3 13  30 40

在 get 方法中会特殊处理这个特殊值，所以你调用 get(10) 的时候会返回 -1，表示没有找到。

同时，你调用 get(20), get(30), get(40) 的时候，还是可以正确地向后找到对应的 value。

这种方法的好处是，不需要进行数据搬移，删除操作处理起来比较简单。

但也有缺点，比如如果你不断地插入和删除元素，table 数组中会出现很多这样占位符，这样会增加连续元素的长度，进而降低 get 方法线性探查的效率。

而且还有一种特殊情况，比如你不断插入和删除元素，导致 table 中全部都是占位符。如果你不对这种情况进行特殊处理，那么此时你调用一次 get 方法，由于环形数组的特性，算法就会陷入死循环。

关注