Hash表的实现原理

最新推荐文章于 2024-07-25 11:43:17 发布

明宇小生

最新推荐文章于 2024-07-25 11:43:17 发布

阅读量4.1k

点赞数 2

分类专栏：数据结构文章标签：数据结构 hash 散列函数

本文链接：https://blog.csdn.net/qq_33344834/article/details/51941023

版权

数据结构专栏收录该内容

2 篇文章 0 订阅

订阅专栏

哈希表存在的意义

哈希表最重要的意义就是快速定位查找，类比来讲就是将Hash表就是将程序中毫无规律的数据项组合成了“新华字典”，根据“哈希表”可以快速找到字典中的每一个字。

哈希表（散列表）快速定位所需要的手段

哈希表目的就是为了使数据均匀分布同时保证计算简单，花费在计算地址上的时间要远小于遍历的时间。

两种散列函数

1直接定址法

在散列之前要知道所有的关键值，且数据之间对应的经过散列函数之后得到的值不能有冲突。（异想天开：只适用于小的数据分布）
这样的散列函数优点就是简单、均匀，也不会产生冲突，但问题是这需要事先知道关键字的分布情况，适合査找表较小且连续的情况。由于这样的限制，在现实应用中，直接定址法虽然简单，但却并不常用。

2除留余数法

根据关键值得取值范围去一个在其范围内最大的质数，这样可以更均匀的散列数据，同时也能减少冲突。（这种方法比较常用）

两种冲突处理的方法

1.开放定址法（线性探测）：
公式为：

fi(key) = (f(key)+di) MOD m (di=1,2,3,......,m-1)

基本上属于顺序查找还有的空下来的位置
根据di的变化有两种不同的探测方法：
二次探测法：双向查找
随机探测发：随机分配，但是这时是伪随机，在查找时和插入用的是同一个随机数

如果发生冲突，这个位置数据项的指针指向下一个数据项的位置。也就是说同义词在一个链内。

2.拉链法
拉链法解决冲突的做法是：将所有关键字为同义词的结点链接在同一个单链表中。若选定的散列表长度为m，则可将散列表定义为一个由m个头指针组成的指针数组T[0..m-1]。凡是散列地址为i的结点，均插入到以T[i]为头指针的单链表中。T中各分量的初值均应为空指针。在拉链法中，装填因子α可以大于 1，但一般均取α≤1。
拉链法的优势与缺点

与开放定址法相比，拉链法有如下几个优点：

拉链法处理冲突简单，且无堆积现象，即非同义词决不会发生冲突，因此平均查找长度较短；
由于拉链法中各链表上的结点空间是动态申请的，故它更适合于造表前无法确定表长的情况；
开放定址法为减少冲突，要求装填因子α较小，故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1，且结点较大时，拉链法中增加的指针域可忽略不计，因此节省空间；
在用拉链法构造的散列表中，删除结点的操作易于实现。只要简单地删去链表上相应的结点即可。而对开放地址法构造的散列表，删除结点不能简单地将被删结 点的空间置为空，否则将截断在它之后填人散列表的同义词结点的查找路径。这是因为各种开放地址法中，空地址单元（即开放地址）都是查找失败的条件。因此在用开放地址法处理冲突的散列表上执行删除操作，只能在被删结点上做删除标记，而不能真正删除结点。

拉链法的缺点：指针需要额外的空间，故当结点规模较小时，开放定址法较为节省空间，而若将节省的指针空间用来扩大散列表的规模，可使装填因子变小，这又减少了开放定址法中的冲突，从而提高平均查找速度。