[哈希表基础知识]

-Gaojs

已于 2022-07-25 18:02:27 修改

阅读量247

点赞数 1

分类专栏： c++ 数据结构文章标签：散列表哈希算法数据结构

于 2022-07-25 17:50:37 首次发布

本文链接：https://blog.csdn.net/m0_65485466/article/details/125979238

版权

c++ 同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

数据结构

8 篇文章 0 订阅

订阅专栏

什么是哈希表

哈希表（Hash table，也叫散列表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

官方的解释可能有点懵，直白来讲其实数组就是一张哈希表。

哈希作为一个非常常用的查找数据结构，它能够在O(1) 的时间复杂度下进行数据查找。
比方说我有一个集合有如下数据，而我想要快速查找一个数据在不在这个集合中，我应该采取什么办法？
哈希表
一般情况下可以使用遍历的方式，但是如果数据量太多，则每次遍历的代价将不可接受。

那么，如果它们是有序的，则可以使用树形数据结构进行二分查找，效率也是非常的高，但很不巧我们这些数据是无序的。

所以就有人想到一个很巧妙的办法来寻找它，就是将要寻找的数据（下文称为键）进行一次计算得到一个数组下标值，然后将这个值放到对应的数组里。
哈希表
以后我们每次寻找的时候都对键进行计算从而得到一个数组下标值，然后通过下标拿到数组对应的数据，就能知道它是否存在于这个数组中了。

这种数据查找的数据结构就叫做哈希表，对键的计算的方法叫做哈希函数。

什么是哈希函数

哈希函数可以把给定的数据转换成固定长度的无规律数值。转换后的无规律数值可以作为数据摘要应用于各种各样的场景。

我们可以把哈希函数想象成搅拌机，如下图所示。
在这里插入图片描述
将数据放入搅拌机里

经过哈希函数计算后，搅拌机会输出固定长度的无规律数值。输出的无规律数值就是“哈希值”。哈希值虽然是数字，但多用十六进制来表示。

计算机使用二进制管理所有数据，虽然哈希值是用十六进制表示的，但它也是数据，计算机在存储哈希值时，会通过计算将其转换为二进制进行管理。
在这里插入图片描述

哈希函数的特征

哈希值的长度与输入数据的大小的无关
输入相同的数据，输出的哈希值也必定相同
输入相似的数据，输出的哈希值必定不同
输入的数据完全不同，但输出的哈希值可能是相同的。这种情况被称作“哈希冲突”
哈希值是不可逆的，通过哈希值不可能反向推算出原本的数据。

哈希冲突

哈希冲突是指多个不同的键散列到了同一个数组下标位置上，案例如下：
在这里插入图片描述
在上图中，耳、朵、不这三个字经过散列之后的数组下标都是0，而且因为是三个不同的值，所以也不能直接在数组上覆盖，那么我们就需要有一个办法把这三个值存起来。

一般哈希冲突有两种解决方法，拉链法和开放地址法。

拉链法：就是在冲突的下标元素处维护一个链表，所有冲突的元素都依次放到这个链表上去：
在这里插入图片描述
在上图中，将冲突的两个键就按照顺序放在了链表中，下次寻找时只需要查看该数组元素以及遍历这个链表即可。
其实拉链法就是要选择适当的哈希表的大小，这样既不会因为数组空值而浪费大量内存，也不会因为链表太长而在查找上浪费太多时间。