哈希表(Hash Table)
数组就是哈希表的一种。哈希表属于键值对结构。哈希表用途用来快速判断一个元素是否出现集合里。
哈希函数(hash function)是一种映射, x → f ( x ) x\to f(x) x→f(x)。如果 x x x 的个数大于 f ( x ) f(x) f(x) 的个数,将对多余的 x x x 进行取模, x % f ( x ) x\%f(x) x%f(x),映射上去。这样会出现哈希碰撞,即不同元素映射到同一位置。有两种解决办法,其一是拉链法,将映射到同一位置的元素通过链表的显示存储;其二是线性探测法,确保 f ( x ) f(x) f(x) 的个数大于 x x x。
常见的哈希结构
- 数组
- 集合
集合 | 底层实现 | 是否有序 | 数值是否可以重复 | 能否更改数值 | 查询效率 | 增删效率 |
---|---|---|---|---|---|---|
std::set | 红黑树 | 有序 | 否 | 否 | O ( log n ) O(\log n) O(logn) | O ( log n ) O(\log n) O(logn) |
std::multiset | 红黑树 | 有序 | 是 | 否 | O ( log n ) O(\log n) O(logn) | O ( log n ) O(\log n) O(logn) |
std::unordered_set | 哈希表 | 无序 | 否 | 否 | O ( 1 ) O(1) O(1) | O ( 1 ) O(1) O(1) |
- 映射
映射 | 底层实现 | 是否有序 | 数值是否可以重复 | 能否更改数值 | 查询效率 | 增删效率 |
---|---|---|---|---|---|---|
std::map | 红黑树 | key 有序 | key 不可重复 | key 不可修改 | O ( log n ) O(\log n) O(logn) | O ( log n ) O(\log n) O(logn) |
std::multimap | 红黑树 | key 有序 | key 可重复 | key 不可修改 | O ( log n ) O(\log n) O(logn) | O ( log n ) O(\log n) O(logn) |
std::unordered_map | 哈希表 | key 无序 | key 不可重复 | key 不可修改 | O ( 1 ) O(1) O(1) | O ( 1 ) O(1) O(1) |
当我们要使用集合来解决哈希问题的时候,优先使用unordered_set,因为它的查询和增删效率是最优的,如果需要集合是有序的,那么就用set,如果要求不仅有序还要有重复数据的话,那么就用multiset。
那么再来看一下map ,在map 是一个key value 的数据结构,map中,对key是有限制,对value没有限制的,因为key的存储方式使用红黑树实现的。
242.有效的字母异位词
题目链接:242.有效的字母异位词
能用数组就用数组,速度快,空间小。判断s的字母在t中是否出现过。 都是小写字母,个数连续可控,用数组。用哈希函数从字母映射到数组。s记录数组之后,t也在同一个数组操作。最后检查数组是否存在非零值。
class Solution {
public:
bool isAnagram(string s, string t) {
//哈希函数,从字母映射到数组
//26个字母对应到数组下标0-25
//每个数组存储的值表示为对应字母出现的次数
int record[26] = {};//一定要初始化为0
for (auto &i: s) {//s中存在的字母
record[i - 'a']++;
}
for (auto &i: t) {//s中存在,t中字母存在与否
record[i - 'a']--;
}
for (auto &i: record) {
if (i) return false;
}
return true;
}
};
349. 两个数组的交集
题目链接: 349. 两个数组的交集
如果哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费!
容器的选择也是考虑的要素之一。判断nums1
数组的元素是否在nums2
中出现过。
vector
和unordered_set
可以相互初始化。
class Solution {
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
unordered_set<int> ret;//选择unordered_set可以去重
unordered_set<int> res(nums1.cbegin(), nums1.cend());//可以用vector初始化
for (auto &i: nums2) {
if (res.find(i) != res.cend()) {
ret.insert(i);
}
}
return vector<int>(ret.begin(), ret.end());//可以用unordered-set初始化
}
};
202. 快乐数
题目链接: 202. 快乐数
判断无限循环且不是快乐数的数是否出现过。
由题意可得,可能是无限循环,需要while(1)
表示无限循环,并且循环做快乐数的定义。问题在于无限循环如何跳出,用unordered_set
记录,如果算数有记录,则被无法跳出循环,return false
。没有记录,则记录到unordered_set
中,重新计算快乐数
class Solution {
public:
//是否是快乐数
int getSum(int& n) {
int sum = 0;
while (n) {
sum += (n % 10) * (n % 10);
n /= 10;
}
return sum;
}
bool isHappy(int n) {
unordered_set<int> res;
while (1) {
int sum = getSum(n);
if (sum == 1) {
return true;
} else if (res.find(sum) != res.end()) {
return false;
} else {
res.insert(sum);
n = sum;
}
}
}
};
1. 两数之和
题目链接: 1. 两数之和
判断相加等于目标值的两个数字是否出现过。
可以通过遍历数组,然后用目标值和当前遍历到的数值作差,求得的值是否在数组存在过。而且题目也要求返回数值对应的下标。因此选用map
结构,key
为数值,检查是否存在,value
为数值对应的下标,返回下标。
class Solution {
public:
vector<int> twoSum(vector<int>& nums, int target) {
unordered_map<int, int> map;//存储数组元素
for (int i = 0; i < nums.size(); i++) {
auto iter = map.find(target - nums[i]);
if (iter != map.end()) {
return {iter->second, i};
}
map.insert(make_pair(nums[i], i));
}
return {};
}
};