数据结构与算法_07_散列表

最新推荐文章于 2023-12-05 19:45:00 发布

Happy编程

最新推荐文章于 2023-12-05 19:45:00 发布

阅读量681

点赞数

分类专栏：算法/数据结构文章标签：散列表哈希算法数据结构

本文链接：https://blog.csdn.net/wanghaiping1993/article/details/125172540

版权

数据结构与算法，系列文章传送地址，请点击本链接。

一、散列思想

散列表用的就是数组支持按照下标随机访问的时候，时间复杂度是 O(1) 的特性。我们通过散列函数把元素的键值映射为下标，然后将数据存储在数组中对应下标的位置。当我们按照键值查元素时，我们用同样的散列函数，将键值转化数组下标，从对应的数组下标的位置取数据。

二、散列函数

散列函数，顾名思义，它是一个函数。我们可以把它定义成 hash(key)，其中 key 表示元素的键值，hash(key) 的值表示经过散列函数计算得到的散列值。

散列函数设计的基本要求：

1、散列函数计算得到的散列值是一个非负整数；--数组下标是0开始的

2、如果 key1 = key2，那 hash(key1) == hash(key2)；

3、如果 key1 ≠ key2，那 hash(key1) ≠ hash(key2)。--

第三点理解起来可能会有问题。这个要求看起来合情合理，但是在真实的情况下，要想找到一个不同的 key 对应的散列值都不一样的散列函数，几乎是不可能的。即便像业界著名的MD5、SHA、CRC等哈希算法，也无法完全避免这种散列冲突。而且，因为数组的存储空间有限，也会加大散列冲突的概率。

三、散列冲突

再好的散列函数也无法避免散列冲突。那究竟该如何解决散列冲突问题呢？我们常用的散列冲突解决方法有两类，开放寻址法（open addressing）和链表法（chaining）。

1. 开放寻址法

开放寻址法的核心思想是，如果出现了散列冲突，我们就重新探测一个空闲位置，将其插入。

A、线性探测

当我们往散列表中插入数据时，如果某个数据经过散列函数散列之后，存储位置已经被占用了，我们就从当前位置开始，依次往后查找，看是否有空闲位置，直到找到为止。

数据插入时，如果出现了散列冲突，在被散列到的位置，往后查找，直到找到空闲位置后，将其插入。

查找元素时，通过散列函数求出要查找元素的键值对应的散列值，然后比较数组中下标为散列值的元素和要查找的元素。如果相等，则说明就是我们要找的元素；否则就顺序往后依次查找。如果遍历到数组中的空闲位置，还没有找到，就说明要查找的元素并没有在散列表中。

在删除数据时，不能直接删除，否则会导致原来的查找算法失效（因为查找的时候，遇到了空空会反回散列表中不存在），所以删除的元素，特殊标记为 deleted。当线性探测查找的时候，遇到标记为 deleted 的空间，并不是停下来，而是继续往下探测。

存在问题：当散列表中插入的数据越来越多时，散列冲突发生的可能性就会越来越大，空闲位置会越来越少，线性探测的时间就会越来越久。极端情况下，我们可能需要探测整个散列表，所以最坏情况下的时间复杂度为 O(n)。同理，在删除和查找时，也有可能会线性探测整张散列表，才能找到要查找或者删除的数据。

B、二次探测

所谓二次探测，跟线性探测很像，线性探测每次探测的步长是 1，那它探测的下标序列就是 hash(key)+0，hash(key)+1，hash(key)+2……而二次探测探测的步长就变成了原来的“二次方”，也就是说，它探测的下标序列就是 hash(key)+0，hash(key)+12，hash(key)+22……

C、双重散列

最低0.47元/天解锁文章

Happy编程

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
数据结构与算法_07_散列表

一、散列思想散列表用的就是数组支持按照下标随机访问的时候，时间复杂度是 O(1) 的特性。我们通过散列函数把元素的键值映射为下标，然后将数据存储在数组中对应下标的位置。当我们按照键值查元素时，我们用同样的散列函数，将键值转化数组下标，从对应的数组下标的位置取数据。...
复制链接

扫一扫