哈希表初篇

最新推荐文章于 2022-02-27 19:36:28 发布

Diehard_Yin

最新推荐文章于 2022-02-27 19:36:28 发布

阅读量1.3k

点赞数

分类专栏：数据结构文章标签：哈希表 c++ 数据结构 hashtable hash

本文链接：https://blog.csdn.net/yinlili2010/article/details/39209963

版权

哈希表，又称散列表，通过哈希函数将数据快速存储和查找。哈希冲突是不可避免的问题，常见的冲突解决方法包括开放定址法、链地址法等。文章详细介绍了哈希函数的构建方法，如直接定址法、除留余数法，并讨论了不同冲突处理策略的优劣。此外，还提供了一个简单的哈希表C++实现例子。

摘要由CSDN通过智能技术生成

一、哈希表

哈希表又称散列表。哈希表存储的基本思想是：以数据表中的每个记录的关键字k为自变量，通过一种函数H(k)计算出函数值。把这个值解释为一块连续存储空间（即数组空间）的单元地址（即下标），将该记录存储到这个单元中。在此称该函数H为哈希函数或散列函数。按这种方法建立的表称为哈希表或散列表。

我们知道：哈希表是一个固定大小的数组，数组的每个元素是一个链表（单向或双向）的头指针。哈希表的查询是飞快的。因为它不需要从头搜索，它利用Key的“哈希算法”直接定位，查找非常快，各种数据库中的数据结构基本都是它。但带来的问题是，哈希表的尺寸、哈希算法。

哈希表的数组是定长的，如果太大，则浪费，如果太小，体现不出效率。合适的数组大小是哈希表的性能的关键。哈希表的尺寸最好是一个质数，最小的质数尺寸是17。

当然，根据不同的数据量，会有不同的哈希表的大小。对于数据量时多时少的应用，最好的设计是使用动态可变尺寸的哈希表，那么如果你发现哈希表尺寸太小了，比如其中的元素是哈希表尺寸的2倍时，我们就需要扩大哈希表尺寸，一般是扩大一倍。

理想情况下，哈希函数在关键字和地址之间建立了一个一一对应关系，从而使得查找只需一次计算即可完成。由于关键字值的某种随机性，使得这种一一对应关系难以发现或构造。因而可能会出现不同的关键字对应一个存储地址。即k1≠k2，但H(k1)=H(k2)，这种现象称为冲突。把这种具有不同关键字值而具有相同哈希地址的对象称“同义词”。

在大多数情况下，冲突是不能完全避免的。这是因为所有可能的关键字的集合可能比较大，而对应的地址数则可能比较少。

对于哈希技术，主要研究两个问题：

（1）如何设计哈希函数以使冲突尽可能少地发生。

（2）发生冲突后如何解决。