拉链法（open hashing）和开地址法(closed hashing或者opened addressing)

最新推荐文章于 2024-06-30 15:01:08 发布

yue_hu

最新推荐文章于 2024-06-30 15:01:08 发布

阅读量1.1w

点赞数 8

分类专栏： JAVA

JAVA 专栏收录该内容

85 篇文章 2 订阅

订阅专栏

拉链法，我们可以理解为 “链表的数组”(转自Java 中的 ==, equals 与 hashCode 的区别与联系）

如图：

　这里写图片描述

　左边很明显是个数组，数组的每个成员是一个链表。该数据结构所容纳的所有元素均包含一个指针，用于元素间的链接。我们根据元素的自身特征把元素分配到不同的链表中去，也是根据这些特征，找到正确的链表，再从链表中找出这个元素。先调用这个元素的 hashCode 方法，然后根据所得到的值计算出元素应该在数组的位置。如果这个位置上没有元素，那么直接将它存储在这个位置上；如果这个位置上已经有元素了，那么调用它的equals方法与新元素进行比较：相同的话就不存了，否则，将其存在这个位置对应的链表中（Java 中 HashSet, HashMap 和 Hashtable的实现总将元素放到链表的表头）。

拉链法的适用范围：快速查找，删除的基本数据结构，通常需要总数据量可以放入内存。

开放定址法（线性探测）

即当一个关键字和另一个关键字发生冲突时，使用某种探测技术在Hash表中形成一个探测序列，然后沿着这个探测序列依次查找下去，当碰到一个空的单元时，则插入其中。比较常用的探测方法有线性探测法，比如有一组关键字{12，13，25，23，38，34，6，84，91}，Hash表长为14，Hash函数为address(key)=key%11，当插入12，13，25时可以直接插入，而当插入23时，地址1被占用了，因此沿着地址1依次往下探测(探测步长可以根据情况而定)，直到探测到地址4，发现为空，则将23插入其中。(转自哈希表详解（知识点拾遗，Top K算法详解）)

下面的例子有助于理解。(转自哈希表详解（附实现代码）)

将关键字序列{7, 8, 30, 11, 18, 9, 14}散列存储到散列表中。散列表的存储空间是一个下标从0开始的一维数组，长度为10，即{0, 1,2, 3, 4, 5, 6, 7, 8, 9}。散列函数为： H(key) = (key * 3) % 7，处理冲突采用线性探测再散列法。

求等概率情况下查找成功和查找不成功的平均查找长度。

解：

1 求散列表

H(7) = (7 * 3) % 7 = 0

H(8) = (8 * 3) % 7 = 3

H(30) = 6

H(11) = 5

H(18) = 5

H(9) = 6

H(14) = 0

按关键字序列顺序依次向哈希表中填入，发生冲突后按照“线性探测”探测到第一个空位置填入。

address	0	1	2	3	4	5	6	7	8	9
key	7	14		8		11	30	18	9

插入key = 18时，根据H(18) = 5应插在addresss=5的位置，但是address=5已经被key=11占据了，所以往后挪一位到address=6的位置，但是address=6被key=30占据了，再往后挪一位到address=7的位置，这个位置是空的，所以key=18就插到这个位置。

插入key = 9时，根据H(9) = 6应插在address=6的位置，但address = 6已经被key = 30占据，所以需要往后挪一位到address = 7的位置，但是address = 7已经被key = 18占据，所以再往后挪移到address = 8的位置，这个位置是空的，所以key = 9就插到这个位置。

插入key=14时，根据H(14) = 0应插在address=0的位置，但address=0被key=7占据，所以往后挪移一位到address=1的位置，这个位置是空的，所以key=14就插到这个位置。

2 求查找成功的平均查找长度

查找7，H(7) = 0，在0的位置，一下子就找到了7，查找长度为1。

查找8，H(8) = 3，在3的位置，一下子就找到了8，查找长度为1。

查找30，H(30) = 6，在6的位置，一下子就找到了30，查找长度为1。

查找11，H(11) = 5，在5的位置，一下子就找到了11，查找长度为1。

查找18，H(18) = 5，第一次在5的位置没有找到18，第二次往后挪移一位到6的位置，仍没有找到，第三次再往后挪移一位到7的位置，找到了，查找长度为3。

查找9，H(9) = 6，第一次在6的位置没找到9，第二次往后挪移一位到7的位置，仍没有找到，第三次再往后挪移一位到8的位置，找到了，查找长度为3.

查找14，H(14) = 0，第一次在0的位置没找到14，第二次往后挪移一位到1的位置，找到了，查找长度为2。

address	0	1	2	3	4	5	6	7	8	9
key	7	14		8		11	30	18	9
length	1	2		1		1	1	3	3

所以，查找成功的平均查找长度为(1 + 1 + 1 + 1 + 3 + 3 + 2) / 7 = 12 / 7。

3 求查找不成功的平均查找长度

address	0	1	2	3	4	5	6	7	8	9
key	7	14		8		11	30	18	9

查找不成功，说明要查找的数字肯定不在上述的散列表中。

因为这里哈希函数的模为7，所以要查找的数只可能位于0~6的位置上。

（1）若要查找的数key对应的地址为0，有(key * 3) % 7 = 0。
因为key不属于{7, 8, 30, 11, 18, 9, 14}，可设key = 28。
第一次查找，address = 0时key = 7，不是要找的28，
第二次查找，往后挪移一位，address = 1时key = 14，不是要找的28；
第三次查找，往后再挪移一位，address = 2时key为空。可知查找不成功，否则28应该放在adress = 2的位置上。
结论：查找3次可知查找不成功。
（2）若要查找的数key 对应的地址为1，有(key * 3) % 7 = 1。
因为key不属于{7, 8, 30, 11, 18, 9, 14}，可设key = 5。
第一次address = 1时key = 14，不是要找的5
第二次adress = 2时key为空。可知查找不成功，否则key = 5应该放在adress=1的位置上。
结论：查找2次可知查找不成功。
（3）若要查找的数key对应的地址为2，有(key * 3) % 7 = 2。
因为key不属于{7, 8, 30, 11, 18, 9, 14}，可设key = 3。
第一次查找，address = 2时key为空。可知查找不成功，否则key = 3应该放在address = 2的位置。
结论：查找1次可知查找不成功。
（4）若要查找的数key对应的地址为3，有(key * 3) % 7 = 3。
因为key不属于{7, 8, 30, 11, 18, 9, 14}，可设key = 15。
第一次查找，address = 3时key = 8，不是要找的15.
第二次查找，往后挪移一位，address = 4时key为空。可知查找不成功，否则key = 15会放在address = 4的位置上。
结论：查找2次可知查找不成功。
（5）若要查找的数key对应的地址为4，有(key * 3) % 7 = 4。
因为key不属于{7, 8, 30, 11, 18, 9, 14}，可设key = 6。
第一次查找，address = 4时key为空。可知查找不成功，否则key = 6会放在address = 4的位置上。
结论：查找1次可知查找不成功。
（6）若要查找的数key对应的地址为5，有(key * 3) % 7 = 5。
因为key不属于{7, 8, 30, 11, 18, 9, 14}，可设key = 4。
第一次查找，address = 5时key = 11，不是要找的4.
第二次查找，往后挪移一位，address = 6时key=30，不是要找的4。
第三次查找，往后再挪移一位，注意此时address = 0而非address = 7，因为模为7，决定了要查找的数只可能位于0~6的位置上。address = 0时key = 7，不是要找的4。
第四次查找，往后再挪移一位，address = 1时key = 14，不是要找的4。
第五次查找，往后再挪移一位，address = 2时key为空。可知查找不成功，否则key = 4会放在address = 2的位置上。
结论：查找5次可知查找不成功。
（7）若要查找的数key对应的地址为5，同理可得出结论：查找4次可知查找不成功。