【算法导论】第十一章散列表学习笔记

最新推荐文章于 2020-08-24 17:00:00 发布

女侠楚楚楚

最新推荐文章于 2020-08-24 17:00:00 发布

阅读量266

点赞数

分类专栏：算法

本文链接：https://blog.csdn.net/tan_change/article/details/80154771

版权

算法专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本文是关于《算法导论》第十一章散列表的学习笔记，介绍了散列表的基本概念，包括直接寻址表和散列表，讨论了散列函数、链接法和开放寻址法解决冲突的方法，并探讨了不同操作如插入、删除和查找的平均时间复杂度。此外，还提到了完全散列在静态关键字场景下的优势。

摘要由CSDN通过智能技术生成

散列表

散列表（hash table）是实现字典操作的一种有效数据结构。尽管在最坏的情况下，在散列表中的查找一个元素的时间与链表中查找的时间相同，为 $O(n)$ 。在一下合理的假设下，在散列表中查找一个元素的时间复杂度为 $O(1)$ 。在散列表中不是直接把关键字作为数组的下标，而是根据关键字计算出相应的下标。

直接寻址表

当关键字的全域 $U$ 比较小时，直接寻址法是简单而有效的。设 $U={0,1,2,…,m-1}$ ，且假设任意两个元素不具有相同的关键字。则数组的大小应为m。

散列表

直接寻址技术的显著缺点是：如果全域 $U$ 非常大，则在一台标准的计算机可用内存中，要存储大小为 $|U|$ 的一张表 $T$ 非常不现实。并且，实际存储的关键字集合 $K$ 相对 $U$ 来说也许很小。这样分配给 $T$ 的空间就大部分被浪费了。

散列表即：利用散列函数(hash function) $h(k)$ ，有关键字 $k$ 计算出槽的位置，函数 $h$ 将关键字的全域 $U$ 映射到散列表(hash table)的槽位上。

存在问题：两个关键字可能会映射到同一个槽中，这叫冲突。如何解决这种冲突？

尽量避免冲突：试图选择一个散列函数能避免冲突或使冲突次数最小化。实际上，散列这个术语的原意就是随机混杂和拼凑，即体现了这种思想。
完全避免冲突几乎是不可能的，所以还是需要有解决冲突的办法
1. 链接法
2. 开放寻址法

链接法

操作的时间复杂度：

插入HASH_INSERT(T,x)：在链表表头进行插入O(1)，前提是假设插入的元素没有出现在表中。否则需要先查找。

删除HASH_DELETE(T,x)：O(1)，前提是假设链表为双向链表（这里没看懂，为什么双向链表可以不用在T中找x?）。否则需要先找到x的前驱节点，这样复杂度就等同于查找的复杂度。

查找HASH_SEARCH(T,k)：定义T的装载因子为 $\alpha=n/m$ ，即一个链表的平均存储元素个数。则查找操作的时间复杂度由两部分组成：

查找失败： $\Theta(1+\alpha)$ ，在简单均匀散列的假设下，任何尚未被存储在表中的关键字k，都等可能的被散列到m个槽中，在槽中的查找时间为 $，\Theta(\alpha)$ ，1则为计算 $h(k)$ 的时间
查找成功： $\Theta(1+\alpha)$ ，根据复杂计算所得…

所以查找操作的时间复杂度为 $\Theta(1+\alpha)$ 。这意味着，如果散列表中槽数至少与表中的元素个数成正比，则查找操作平均也只需要常数的时间—— $O(1)$

思考：

算法导论练习题：11.2-3

题目：对链表法进行改进，保证链表有序，则散列性能能得到较大的提高。试分析这种改动对成功查找、失败查找、插入和删除的运行时间各有什么影响？

插入：由于链表有序，用插入排序比较合适，此时为时间复杂度为 $O(n/m)=O(\alpha)$
成功查找和失败查找：二分法 $O(lg\alpha)$
删除：与查找线性相关 $O(lg\alpha)$

散列函数

除法散列法
- $h(k)=k~mod~m$ ，对m的选择敏感，m一般**不为**2的幂。
乘法散列法
- 优点是对m的选择不敏感，m一般为2的幂。
全域散列法
- 随机的选择散列函数，使之独立于存储的关键字k。随机化保证了没有那种输入会始终导致最坏的性能出现（类似于快排中随机选择povio）。

开放寻址法

所有元素都存放在散列表里，也就是说每个表项或包含动态集合中的一个元素，或包含NIL。当查找某个元素时，要系统的检查所有的表项，直到找到所需元素，或最终查明改元素不在表中。与链表法不一样，这里既没有链表，也没有元素存放在散列表以外，因此开放寻址法中，散列表可能会被填满，且导致装载因子 $\alpha$ 一定不超过1。

因为不用存储指针，所以用链表法存储指针的空间在这里可以用来存储元素，即用相同的空间存储了更多的元素槽，潜在的减少了冲突提高了检索速度。