Hash算法解决哈希冲突的四种方法

最新推荐文章于 2021-11-09 10:03:02 发布

雪人奥特曼Q

最新推荐文章于 2021-11-09 10:03:02 发布

阅读量570

点赞数

分类专栏：数据结构算法文章标签：哈希冲突

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013025748/article/details/106345289

版权

数据结构同时被 2 个专栏收录

22 篇文章 0 订阅

订阅专栏

13 篇文章 1 订阅

订阅专栏

目录

一、开放地址法：

寻址方法：

1、线性探测

2、二次探测

3、双重散列

二、链表法

潜在的问题：

三、建立公共溢出区：

一、开放地址法：

所谓的开放定址法就是一旦发生了冲突，就去寻找下一个空的散列地址，只要散列表足够大，空的散列地址总能找到，并将记录存入。

寻址方法：

1、线性探测

某个数据经过散列函数散列之后，存储位置已经被占用了，我们就从当前位置开始，依次往后查找，看是否有空闲位置，直到找到为止。

元素的查找：通过散列函数求出要查找元素的键值对应的散列值，然后比较数组中下标为散列值的元素和要查找的元素。如果相等，则说明就是我们要找的元素；否则就顺序往后依次查找。如果遍历到数组中的空闲位置，还没有找到，就说明要查找的元素并没有在散列表中。

元素的删除：通过线性探测方法，找到一个空闲位置，就可以认定散列表中不存在这个数据。但是，如果这个空闲位置是我们后来删除的，就会导致原来的查找算法失效。本来存在的数据，会被认定为不存在。这个问题如何解决呢？我们可以将删除的元素，特殊标记为 deleted。当线性探测查找的时候，遇到标记为 deleted 的空间，并不是停下来，而是继续往下探测。

存在的问题：当散列表中插入的数据越来越多时，散列冲突发生的可能性就会越来越大，空闲位置会越来越少，线性探测的时间就会越来越久。极端情况下，我们可能需要探测整个散列表，所以最坏情况下的时间复杂度为 O(n)。同理，在删除和查找时，也有可能会线性探测整张散列表，才能找到要查找或者删除的数据。

2、二次探测

二次探测探测的步长就变成了原来的“二次方”，下标序列就是 hash(key)+0，hash(key)+1^2，hash(key)+2^2

3、双重散列

就是不仅要使用一个散列函数。我们使用一组散列函数 hash1(key)，hash2(key)，hash3(key)……我们先用第一个散列函数，如果计算得到的存储位置已经被占用，再用第二个散列函数，依次类推，直到找到空闲的存储位置；

装载因子

不管采用哪种探测方法，当散列表中空闲位置不多的时候，散列冲突的概率就会大大提高。

装载因子（填入表中的元素个数/散列表的长度）来表示空位的多少。装载因子越大，说明空闲位置越少，冲突越多，散列表的性能会下降。

二、链表法

存在多HashMap使用的处理hash冲突的方式，链表的形式，在同一个位置存放多个元素。

潜在的问题：

恶意的攻击者，可能通过精心构造的数据，所有的数据经过散列函数之后，都散列到同一个槽里。基于链表的冲突解决方法，在这个时候，散列表就会退化为链表，查询的时间复杂度就从 O(1) 急剧退化为 O(n)。

三、建立公共溢出区：

基本思想是：将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，一律填入溢出表

数据结构和算法之美 - 18

雪人奥特曼Q

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。