C++ 哈希详解

最新推荐文章于 2025-03-29 10:17:21 发布

最爱榴莲糖

最新推荐文章于 2025-03-29 10:17:21 发布

阅读量2.3k

点赞数 2

分类专栏： STL 文章标签： c++

本文链接：https://blog.csdn.net/yn_zi/article/details/131438966

版权

STL 专栏收录该内容

4 篇文章

订阅专栏

一、什么是哈希

哈希（Hash）是一种常用的数据结构和算法，用于将数据快速映射到一个固定大小的索引值，从而实现高效的数据查找、插入和删除操作。哈希算法能够通过计算数据的哈希值，将其均匀地映射到哈希表（Hash Table）中。

理想的搜索方法：可以不经过任何比较，一次直接从表中得到要搜索的元素。

如果构造一种存储结构，通过某种函数使元素存储位置与它的关键码之间能够建立一一映射的关系，那么在查找时通过该元素可以很快找到该元素。

当向该结构中插入元素时：

根据待插入元素的关键码，以此函数计算出该元素的存储位置并按此位置进行存放。

搜索元素时：

对元素的关键码进行同样的计算，把求得的函数值当做元素的存储位置，在节后中按此位置取元素比较，若关键码相等，则搜索成功。

该方式即为哈希(散列)方法，哈希方法中使用的转换函数称为哈希(散列)函数，构造出来的结构称为哈希表(或称散列表)。

二、映射方法

这里要解决的问题就是比如对于数据集合(25,66,79,98)，应该采用什么样的映射方式，映射到哈希表中呢？

映射方法多种多样，下面我们讲解两种：直接定址法和除留余数法。

2.1 直接定址法

直接定址法（Direct Addressing）：使用一个固定的偏移量或简单的数学运算将输入直接映射到哈希表位置。映射值跟关键字直接或者间接相关。

在使用直接定址法时，每一个可能的输入值都对应着哈希表中的一个位置。具体来说，当使用直接定址法时，我们可以通过一个固定的偏移量或者一个简单的数学运算来计算输入值对应的哈希表位置。这个偏移量或数学运算通常与输入值的某些特征相关。

2.1.1使用示例

假设我们有一个存储学生信息的哈希表，其中每个学生的学号是唯一的。我们将学生的学号作为输入值，并将其对应的哈希表位置存储该学生的信息。

首先，我们需要定义一个合适大小的哈希表，该表的大小应该能够容纳所有可能的输入值。

然后，我们定义一个直接定址函数，该函数接受学生的学号作为输入，并通过简单的运算得到对应的哈希表位置。

当需要插入或查找学生信息时，我们只需通过学号运算得到对应的哈希表位置，并在该位置存储或检索学生信息。

2.2.2优缺点

直接定址法的优点是操作简单，时间复杂度为O(1)，即常数级别。然而，它要求输入的取值范围必须是已知的且能够预先计算出对应的哈希表位置。如果输入的范围很大或者不连续，直接定址法可能会导致哈希表中的某些位置被频繁使用，而其他位置却未被使用，从而影响了哈希表的效率。

直接定址法是没有哈希冲突的，因为每个值都映射了一个唯一位置。

2.2 除留余数法

除留余数法（Division Method）：将输入值除以一个不大于哈希表大小的固定数，并保留余数作为哈希值。

所谓除，就是除以哈希表的大小，留就是留其余数。

2.2.1 使用示例

首先，确定哈希表的大小，通常选择一个质数或者接近质数的数作为哈希表的大小。

将输入值除以哈希表的大小，并取得其余数。这个余数就作为该输入值的哈希值。

将计算得到的哈希值作为索引，在哈希表中存储或查找对应的数据。

示例：假设哈希表的大小为10，我们要将输入值23、45和67映射到哈希表中。

将25除以10，得到的商为2，余数为5。因此，输入值25的哈希值为5。

将66除以10，得到的商为6，余数为6。因此，输入值66的哈希值为6。

将79除以10，得到的商为7，余数为9。因此，输入值79的哈希值为9。

将98除以10，得到的商为9，余数为8。因此，输入值98的哈希值为8。

2.2.2 优缺点

在实际应用中，除留余数法可以很容易地通过取余运算来实现，因为大多数编程语言都提供了取余操作符。

除留余数法的优点是简单、高效，并且适用于大多数情况。然而，如果输入值的分布不均匀或者哈希表大小选择不当，可能会导致哈希冲突（Hash Collision）的发生，即不同的输入值映射到了同一个哈希值。为了解决哈希冲突，需要采用适当的冲突处理方法，如链接法（重点）（Chaining）或开放定址法（Open Addressing）等。