基础知识
一般来说哈希表都是用来快速判断一个元素是否出现集合里。
哈希函数是把传入的key映射到符号表的索引上。
哈希碰撞处理有多个key映射到相同索引上时的情景,处理碰撞的普遍方式是拉链法和线性探测法
图都来自代码随想录
拉链法: 将发生冲突的元素放在链表中即可
线性探测法:一定要保证tableSize大于dataSize,如果发生冲突那么就找他的下一个位置存放
接下来是常见的三种哈希结构:
- 数组
- set(集合)
- map(映射)
数组就不多说了
数组做哈希表
数组做哈希表时,适用于数据范围不大的情况下,例如字符串中的字母,如果只有小写字母用hash[26]即可,用对应字符-'a'做映射,如果有所有字符,那么就用hash[128]即可。
Set做哈希表
主要因为如下两点:
- 数组的大小是有限的,受到系统栈空间(不是数据结构的栈)的限制。
- 如果数组空间够大,但哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。
所以此时一样的做映射的话,就可以使用set了,底层实现就不需要多加赘述了
同样的有时候看到不出现重复元素,也可以试着想能不能用set来进行去重操作
Map做哈希表
在两数之和中map出现了
使用数组和set来做哈希法的局限
- 数组的大小是受限制的,而且如果元素很少,而哈希值太大会造成内存空间的浪费。
- set是一个集合,里面放的元素只能是一个key,而两数之和这道题目,不仅要判断y是否存在而且还要记录y的下标位置,因为要返回x 和 y的下标。所以set 也不能用。
map是一种<key, value>
的结构,本题可以用key保存数值,用value在保存数值所在的下标。所以使用map最为合适
四数相加也是用这种办法,因为不需要考虑去重操作
而这章我还学到了剪枝和去重操作,具体的可以去看三数之和和四数之和代码随想录算法训练营第七天 | 454.四数相加II、383. 赎金信、15. 三数之和、18. 四数之和-CSDN博客
一些常用的用法(c++中)
map.find() map.insert(pair<int,int>()) unodered_map<int,int>
map.end() 指向最后一个元素的迭代器 map[元素] 这样出来的就是值
auto item = map.find(元素) 找到这个元素对应的键值对
item->second 指向值