哈希表基础知识

最新推荐文章于 2024-11-17 21:09:41 发布

小小小码猿

最新推荐文章于 2024-11-17 21:09:41 发布

阅读量52

点赞数

分类专栏： #代码随想录学习打卡文章标签：散列表数据结构链表

原文链接：https://www.programmercarl.com/%E5%93%88%E5%B8%8C%E8%A1%A8%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%80.html#%E5%B8%B8%E8%A7%81%E7%9A%84%E4%B8%89%E7%A7%8D%E5%93%88%E5%B8%8C%E7%BB%93%E6%9E%84

版权

#代码随想录学习打卡专栏收录该内容

38 篇文章 0 订阅

订阅专栏

哈希表是一种通过哈希函数快速访问数据的数据结构，常用于判断元素是否存在。哈希碰撞可能导致效率下降，解决方法包括拉链法和线性探测法。C++中的unordered_set和unordered_map利用哈希表实现，提供O(1)的平均查询和增删效率。set和map基于红黑树，保证有序性但效率略低。

摘要由CSDN通过智能技术生成

基础理论

哈希表是根据关键码的值直接进行访问的数据结构
一般哈希表都是用来快速判断一个元素是否出现集合里

哈希函数

例如，查询学校里是否有某位学生，将学生的名字映射为哈希表的索引，根据索引下标快速查询这位同学是否在学校名单里，时间复杂度为O(1)
通过hashCode将学生名字转换为数值，hashCode是通过特定的编码方式，将其他的数据格式转换为数值，这样就可以将学生的姓名转换为哈希表的索引下标了
哈希函数
hashCode取模是因为如果hashCode算出来的索引数值大于tableSize，也就是哈希表的大小，就需要取模让其落在哈希表内。那么，如果学生的数量大于哈希表的大小，那么就会有一些学生的名字同时映射到同一个索引下标的位置，这就是哈希碰撞问题。

哈希碰撞

如图所示，小李和小王都映射到了索引下标为1的位置，这一现象就称为哈希碰撞

哈希碰撞一般有两种解决方法，分别是拉链法和线性探测法

拉链法

就是当发生哈希碰撞时，将发生冲突的数据都存放在该索引下的链表内
拉链法

线性探测法

当发生冲突时，将第一个元素放入哈希表内，则后面发生冲突的元素就放在该索引后的空位置，因此需要 tableSize > dataSize，需要足够的哈希表空间来存放发生冲突的元素
线性探测法

常见的三种哈希结构

数组
集合（set）
映射（map）
在C++中，set和map分别提供了三种数据结构

集合	底层实现	是否有序	数值是否可重复出现	能否更改数值	查询效率	增删效率
std::set	红黑树	有序	否	否	O(log n)	O(log n)
std::multiset	红黑树	有序	是	否	O(log n)	O(log n)
std::unordered_set	哈希表	无序	否	否	O(1)	O(1)

std::unordered_set底层实现为哈希表，std::set 和std::multiset 的底层实现是红黑树，红黑树是一种平衡二叉搜索树，所以key值是有序的，但key不可以修改，改动key值会导致整棵树的错乱，所以只能删除和增加
当我们要使用集合来解决哈希问题的时候，优先使用unordered_set，因为它的查询和增删效率是最优的，如果需要集合是有序的，那么就用set，如果要求不仅有序还要有重复数据的话，那么就用multiset.

映射	底层实现	是否有序	数值是否可重复出现	能否更改数值	查询效率	增删效率
std::map	红黑树	key有序	key不可重复	key不可修改	O(log n)	O(log n)
std::multismap	红黑树	key有序	key可重复	key不可修改	O(log n)	O(log n)
std::unordered_map	哈希表	key无序	key不可重复	key不可修改	O(1)	O(1)

std::unordered_map 底层实现为哈希表，std::map 和std::multimap 的底层实现是红黑树。同理，std::map 和std::multimap 的key也是有序的（这个问题也经常作为面试题，考察对语言容器底层的理解）
那么再来看一下map ，在map 是一个key-value 的数据结构，map中，对key是有限制，对value没有限制的，因为key的存储方式使用红黑树实现的。

虽然std::set、std::multiset 的底层实现是红黑树，不是哈希表，std::set、std::multiset 使用红黑树来索引和存储，不过给我们的使用方式，还是哈希法的使用方式，即key和value。所以使用这些数据结构来解决映射问题的方法，我们依然称之为哈希法。 map也是一样的道理。