哈希(散列)

最新推荐文章于 2024-07-29 04:40:48 发布

Lu Zelin

最新推荐文章于 2024-07-29 04:40:48 发布

阅读量7k

点赞数 6

分类专栏： # DataStructure 文章标签：哈希算法散列表数据结构

本文链接：https://blog.csdn.net/qq_40342400/article/details/127232483

版权

DataStructure 专栏收录该内容

12 篇文章 4 订阅

订阅专栏

散列

导入

之前，我们学过在顺序表中如何查找一个元素。

如果这个顺序表里的元素无序，我们可以从表头开始依次进行比较，判断 $a [i]$ 与 $k ey$ 是否相等。

如果这个顺序表里的元素有序，我们可以利用其单调性进行二分查找从而提高平均查找效率。

问题！！！

无论是顺序查找还是二分查找，在查找过程中“比较”都不可避免，但是这是否必要？我们能不能直接通过关键字 $k ey$ 来确定它的存储位置呢？

答：散列表

在这里插入图片描述

定义

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数 $(哈希函数)$ ，存放记录的数组叫做散列表 $(哈希表)$ 。

优势与弊端

优势：散列技术最适合的求解问题是查找与给定值相等的记录。对于查找来说，简化了比较过程，效率就会大大提高。

弊端：对于相同关键码值对应很多记录的情况就不适合用散列。

PS:

算法和数据结构往往是互不分开的。离开了算法，数据结构就显得毫无意义，而没有了数据结构算法就没有实现的条件。良好的数据结构思想就是一种高效的算法，但是数据结构不等于算法。只有当数据结构用于处理某个特定问题类型的时候，数据结构才会体现为算法。

散列主要是面向查找的数据结构

在这里插入图片描述

散列函数的构造

构造准则

散列函数的构造准则：简单、均匀。

（1）散列函数的计算简单，快速；

（2）使哈希地址均匀地分布在地址集 ${0,1，…，m-1\}$ 上，并且冲突最小。

构造方法

（1）直接定址法

取关键字或关键字的某个线性函数值为哈希地址： $f (k ey) = a * k ey + b$

其中 $a$ 和 $b$ 为常数，这种哈希函数叫做自身函数。当 $a = 1 ， b = 0$ 时， $f (k ey) = k ey$ 。

注意：由于直接定址所得地址集合和关键字集合的大小相同，因此，对于不同的关键字不会发生冲突。但是，因为需要提前确定关键字的取值范围，且取值范围不能太大，所以，实际中能使用直接定址法的场景少之又少。

（2）相乘取整法

首先用关键字 $k ey$ 乘上某个常数 $A (0 < A < 1)$ ，并抽取出 $k ey * A$ 的小数部分；然后用 $m$ 乘以该小数后取整。

注意：该方法最大的优点是 $m$ 的选取比除留余数法要求更低。比如，完全可选择它是 $2$ 的整数次幂。虽然该方法对任何 $A$ 的值都适用，但对某些值效果会更好。 $K n u t h$ 建议选取 $0.61803$ ……。

（3）平方取中法

当无法确定关键字中哪几位分布较均匀时，先求出关键字的平方值，然后按需要取平方值的中间几位作为哈希地址。

通过平方扩大差别，另外，中间几位与关键字中的每一位都相关，故不同关键字会以较高的概率产生不同的、均匀的哈希地址。这是一种较常用的构造哈希函数的方法。

举例：将一组关键字 $(0100 ， 0110 ， 1010 ， 1001 ， 0111)$

平方后得(0010000，0012100，1020100，1002001，0012321)

若取表长为 $1000$ ，则可取中间的三位数作为散列地址集： $(100 ， 121 ， 201 ， 020 ， 123)$ 。

（4）伪随机数法

选择一个伪随机函数，取关键字的随机函数值为它的哈希地址，即 $f (k ey) = r an d o m (k ey)$ ，其中 $r an d o m$ 为伪随机函数。通常，当关键字长度不等时采用此法构造哈希函数较恰当。

（5）数字分析法

假设已经知道哈希表中所有的关键字值，而且关键字值都是数字，则可以取关键字值的若干位数字组成哈希地址，这种方法叫做数字分析法。

举例：有 $1000$ 个记录，关键字为 $10$ 位十进制整数 $x 1, x 2, x 3 \dots x 10$ ，如哈希表长度为2000。假设经过分析，各关键字中 $x 3 、 x 5$ 和 $x 7$ 的取值分布近似随机，则可使哈希函数为： $f (k ey) = x 3 x 5 x 7$ 。例如，f(3778597189)=757，f(9166372560)=632。