1. 哈希表基础知识
1.1 哈希表
哈希表一般用于快速判断一个元素是否出现在集合中
哈希表由两部分构成,键值和值。
哈希函数用于将key值映射到哈希表上
哈希碰撞处理有多个key映射到相同索引上时的情景,处理碰撞的普遍方式是拉链法和线性探测法。
1.2 哈希表的三种实现方式
- 数组
- set(集合)
- map(映射)
1.2.1 set
std::unordered_set底层实现为哈希表,std::set 和std::multiset 的底层实现是红黑树,红黑树是一种平衡二叉搜索树,所以key值是有序的,但key不可以修改,改动key值会导致整棵树的错乱,所以只能删除和增加。
1.2.2 map
std::unordered_map 底层实现为哈希表,std::map 和std::multimap 的底层实现是红黑树。同理,std::map 和std::multimap 的key也是有序的
2. 经典题目总结
2.1 使用数组作为哈希表
22. 有效字母异位词、384. 赎金信、49. 字母异位词分组、438. 找到字符串中所有字符异位词_清榎的博客-CSDN博客
对于一些key值较少的情况可以考虑使用数组作为哈希表来进行比对,虽然几道题目用map确实可以,但使用map的空间消耗要比数组大一些,因为map要维护红黑树或者符号表,而且还要做哈希函数的运算。所以数组更加简单直接有效!(我在写时只有最后一道用了数组,其他都用了map)
2.2 使用map和set
349. 两个数组的交集、350. 两个数组的交集Ⅱ_清榎的博客-CSDN博客
这两题目没有限制数值的大小,就无法使用数组来做哈希表了。
主要因为如下两点:
- 数组的大小是有限的,受到系统栈空间(不是数据结构的栈)的限制。
- 如果数组空间够大,但哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。
set比较适合用于替代数组,因为无需记录多个值,map在对于值需要着重记录的地方使用比较方便。std::unordered_set、std::unordered_map的底层实现是哈希, 使用二者读写效率是最高的,因此一般多考虑unordered_set、unordered_map。
202. 快乐数、1. 两数之和、454. 四数相加Ⅱ_清榎的博客-CSDN博客
set是一个集合,里面放的元素只能是一个key,而两数之和这道题目,不仅要判断y是否存在而且还要记录y的下标位置,因为要返回x 和 y的下标。所以set 也不能用,必须使用map。
四数相加Ⅱ乍一看和四数之和、三数之和差不多,但是不是。关键差别是四数相加是为四个独立的数组,只要找到A[i] + B[j] + C[k] + D[l] = 0就可以,而且不用考虑重复问题,使用哈希表法很好做。
15. 三数之和(哈希表法、双指针法)、18. 四数之和_清榎的博客-CSDN博客
两数之和使用哈希表法简单做出,但在三数之和、四数之和中哈希表法则较难实现,因为要求不能重复,去重十分困难,使用双指针法反倒是容易考虑。
此处也得明白什么如果需要返回下标那只能用哈希表法,如果返回值那双指针法、哈希表法均可,但双指针法更易实现。