初识C++之哈希

最新推荐文章于 2024-06-08 00:22:39 发布

网络天使莱娜酱

最新推荐文章于 2024-06-08 00:22:39 发布

阅读量582

点赞数 1

分类专栏： C++ # stl库文章标签：哈希算法数据结构算法 c++ 开发语言

本文链接：https://blog.csdn.net/Masquerena114514/article/details/129944267

版权

本文介绍了哈希概念，指出哈希是一种通过特定函数使元素存储位置与关键码建立一一映射关系的搜索方法，以提高查找效率。接着详细讲解了直接定址法和除留余数法两种哈希函数，讨论了哈希冲突及其解决方案，包括线性探测和二次探测。此外，还探讨了哈希表和哈希桶的模拟实现。

摘要由CSDN通过智能技术生成

一、哈希概念

在以前我们所学习的数据结构，如顺序结构和平衡树，它们的元素关键码与其存储位置之间没有对应关系。因此在查找一个元素时，必要要对关键码进行多次比较。其中，顺序查找的时间复杂度为O（N），平衡树中为树的高度，即O（logN）。它们的搜索效率取决于搜素过程中元素的比较次数。

尽管如此，它们依然不是最为理想的搜索方法。最理想的搜索方法是可以不经过任何比较，一次直接从表中得到要搜索的元素。

既然如此，我们就可以通过构造一种存储结构，通过某种函数使元素的存储位置与它的关键码之间能够建立一一映射的关系，在查找时通过调用函数就能够很快找到对应的元素。

由此可以得到该数据结构的实现思路：

在插入元素时，根据待插入元素的关键码，通过特定函数计算出该元素的存储位置并存放

在搜索元素时，对元素的关键码通过同样的函数进行计算，找到该元素的存储位置并取出。此时就实现了常数次的搜索。

这种搜索数据的方法就好比，在图书馆中，当我们想要借一本书时，并不是自己去图书馆的书架上面一本一本的去查找。而是会去询问图书管理员，他会帮你查询对应书的位置，告诉你这本书在几楼几号区域的几号书架上的几号位置，此时你就可以拿着这个关键码，去对应的位置上取这本书。这其实就是一种“哈希”思想。

因此，“哈希”其实就是一种“映射思想”，并不是某种具体的数据结构。而通过哈希思想衍生出来的，例如“哈希桶”，这种才是具体的数据结构。

二、常见哈希函数

哈希函数是用于获取数据对应的关键码而诞生的。在这里就介绍两种比较常用的哈希函数。当然，实际中还存在大量的其他优秀哈希函数，有兴趣的话大家可以自行了解。

1.直接定址法

这种方法我们以前其实也用过。例如要找到一串小写英文字母中的最先出现的重复值。因为小写英文字母一共只有26个，所以就可以开一个具有26个空间的数组，然后将字符串中的每个字母都一一映射到数组中，例如‘a’映射到0，‘b’映射到1。映射完成后，再遍历字符串，根据字符串的次序在数组中查询对应字母的出现次数，找到第一个大于1的位置即可。这其实就是运用了哈希的直接定址法思想。

直接定址法，即取关键字的某个线性函数为散列地址：Hash(key) = A*key + B。

它的优点就是实现和理解起来都非常简单易懂。

但缺点也很明显。首先我们需要知道关键字的分布情况。即它们所处的区间。第二点也是最致命的缺点，那就是它只适合查找数据连续的情况。

例如有一组数字“1， 2， 10 ，6， 12， 8”，这种数字分布就比较均匀且连续，就比较适合使用直接定址法。但是，如果这组数据出现一个比较大的数字，如100，乃至1000。此时它的最小值为1，而最大值却是它的100倍千倍，此时如果使用直接定址法查找，仅仅7个的数据，就需要开大量的空间，空间浪费严重。