散列表1（Hash Table）

最新推荐文章于 2024-01-22 21:00:00 发布

草莓味的狮子座leo

最新推荐文章于 2024-01-22 21:00:00 发布

阅读量146

点赞数

分类专栏：数据结构与算法文章标签：散列表

本文链接：https://blog.csdn.net/Mikon_0703/article/details/113882725

版权

数据结构与算法专栏收录该内容

15 篇文章 0 订阅

订阅专栏

本文介绍了散列表的基础概念，包括散列函数的设计原则和散列冲突的解决方法，如线性探测、二次探测和双重探测。讨论了装载因子对散列表性能的影响，并提出链表法作为另一种处理冲突的策略。同时，以单词拼写检查为例，展示了散列表在快速查找和拼写检查中的应用。

摘要由CSDN通过智能技术生成

一、散列思想

散列表用的是数组支持按照下标随机访问数据的特性，所以散列表其实就是数组的一种扩展，由数组演化而来。可以说，如果没有数组，就没有散列表

在这里插入图片描述

1.散列函数

把它定义成 hash(key)，其中 key 表示元素的键值，hash(key) 的值表示经过散列函数计算得到的散列值。

散列函数的设计要求：

散列函数计算得到的散列值是一个非负整数；
如果 key1 = key2，那 hash(key1) == hash(key2)；
如果 key1 ≠ key2，那 hash(key1) ≠ hash(key2)。

2.散列冲突

开放寻址法

如果出现了散列冲突，我们就重新探测一个空闲位置，将其插入

**线性探测法：**当我们往散列表中插入数据时，如果某个数据经过散列函数散列之后，存储位置已经被占用了，我们就从当前位置开始，依次往后查找，看是否有空闲位置，直到找到为止
在这里插入图片描述
将删除的元素，特殊标记为deleted，当线性探测查找时，遇到标记为deleted时，继续向下探测

在这里插入图片描述
二次探测：跟线性探测很像，线性探测每次探测的步长是 1，那它探测的下标序列就是 hash(key)+0，hash(key)+1，hash(key)+2……而二次探测探测的步长就变成了原来的“二次方”，也就是说，它探测的下标序列就是 hash(key)+0，hash(key)+12，hash(key)+22……

**双重探测：**不仅要使用一个散列函数。我们使用一组散列函数 hash1(key)，hash2(key)，hash3(key)……我们先用第一个散列函数，如果计算得到的存储位置已经被占用，再用第二个散列函数，依次类推，直到找到空闲的存储位置。

装载因子：

散列表的装载因子=填入表中的元素个数/散列表的长度
装载因子越大，说明空闲位置越少，冲突越多，散列表的性能会下降。

链表法

问题：Word 文档中单词拼写检查功能是如何实现的？

常用的英文单词有 20 万个左右，假设单词的平均长度是 10 个字母，平均一个单词占用 10 个字节的内存空间，那 20 万英文单词大约占 2MB 的存储空间，就算放大 10 倍也就是 20MB。对于现在的计算机来说，这个大小完全可以放在内存里面。所以我们可以用散列表来存储整个英文单词词典。当用户输入某个英文单词时，我们拿用户输入的单词去散列表中查找。如果查到，则说明拼写正确；如果没有查到，则说明拼写可能有误，给予提示。借助散列表这种数据结构，我们就可以轻松实现快速判断是否存在拼写错误。