只要看到找元素,就要立刻想到用哈希来做试试看,用什么数据结构
在C++中,set 和 map 分别提供以下三种数据结构,其底层实现以及优劣如下表所示:
集合 | 底层实现 | 是否有序 | 数值是否可以重复 | 能否更改数值 | 查询效率 | 增删效率 |
---|---|---|---|---|---|---|
std::set | 红黑树 | 有序 | 否 | 否 | O(log n) | O(log n) |
std::multiset | 红黑树 | 有序 | 是 | 否 | O(logn) | O(logn) |
std::unordered_set | 哈希表 | 无序 | 否 | 否 | O(1) | O(1) |
std::unordered_set底层实现为哈希表,std::set 和std::multiset 的底层实现是红黑树,红黑树是一种平衡二叉搜索树,所以key值是有序的,但key不可以修改,改动key值会导致整棵树的错乱,所以只能删除和增加。
映射 | 底层实现 | 是否有序 | 数值是否可以重复 | 能否更改数值 | 查询效率 | 增删效率 |
---|---|---|---|---|---|---|
std::map | 红黑树 | key有序 | key不可重复 | key不可修改 | O(logn) | O(logn) |
std::multimap | 红黑树 | key有序 | key可重复 | key不可修改 | O(log n) | O(log n) |
std::unordered_map | 哈希表 | key无序 | key不可重复 | key不可修改 | O(1) | O(1) |
242.有效的字母异位词
建议: 这道题目,大家可以感受到 数组 用来做哈希表 给我们带来的遍历之处。
题目链接/文章讲解/视频讲解: 代码随想录 (programmercarl.com)
虽然以前在学校就一直听过哈希表这种东西,不过真正使用哈希表来解题目,我这还是第一次,也算是第一次接触哈希表吧。哈希表有三种解法,一种是数组,一种是set(主要应对集合),一种是map(主要是映射)。
242这道题呢,就是用数组的一种哈希表,比较简单,但是老师的思路真的是奇特,这题对应的哈希值都是在26个字母里面的,所以就创建一个26长度大小的数组,都是小写字母,所以哈希函数就是s[i]-'a',这样的话就能很好的将字母放进哈希数组里面了。更妙的地方就是,判断两个字符串是不是字母异位词,直接将另一个字符串也进行哈希的转换,但是这次直接也用同一个哈希数组,直接相减!!!如果最后遍历哈希数组,结果都是0的话,说明两个字符串就是字母异味词!
给你一个元素,让你判断是否在一个序列出现过,就用哈希表
349. 两个数组的交集
建议:本题就开始考虑 什么时候用set 什么时候用数组,本题其实是使用set的好题,但是后来力扣改了题目描述和 测试用例,添加了 0 <= nums1[i], nums2[i] <= 1000 条件,所以使用数组也可以了,不过建议大家忽略这个条件。 尝试去使用set。
题目链接/文章讲解/视频讲解:代码随想录 (programmercarl.com)
要注意,使用数组来做哈希的题目,是因为题目都限制了数值的大小。而这道题目没有限制数值的大小,就无法使用数组来做哈希表了。而且如果哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。
std::set和std::multiset底层实现都是红黑树,std::unordered_set的底层实现是哈希表, 使用unordered_set 读写效率是最高的,并不需要对数据进行排序,而且还不要让数据重复,所以选择unordered_set。
unordered_set的范围通常是由两个迭代器开始的,即一个begin(),一个end()。
class Solution {
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
unordered_set<int> result_set;
unordered_set<int> nums_set(nums1.begin(),nums1.end());
for(int num:nums2)
{
if(nums_set.find(num)!=nums_set.end())
{
result_set.insert(num);
}
}
return vector<int>(result_set.begin(),result_set.end());
}
};
这题的一些c++的语法还需要多多注意,把图截出来了。比如说nums_set.find(num),如果find找到num的值的话,就会直接返回该值的迭代器,如果没找到该值的话,就会返回nums_set.end()。vector和hash之间的转换要用(begin(),end())。
202. 快乐数
建议:这道题目也是set的应用,其实和上一题差不多,就是 套在快乐数一个壳子
题目链接/文章讲解:代码随想录 (programmercarl.com)
这道题的话,也是用到了一个unordere_set,用了他的一个性质就是,不重复的原则,但感觉这道题其实用数组都可以做出来(肤浅的认为。。。)
这道题的话要进行一个题意的解读,
道题目看上去貌似一道数学问题,其实并不是!
题目中说了会 无限循环,那么也就是说求和的过程中,sum会重复出现,这对解题很重要!
正如:关于哈希表,你该了解这些! (opens new window)中所说,当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法了。
所以这道题目使用哈希法,来判断这个sum是否重复出现,如果重复了就是return false, 否则一直找到sum为1为止。
判断sum是否重复出现就可以使用unordered_set。
所以就是要一个函数进行拆分,平方相加,为unordered_set做判断。
1. 两数之和
建议:本题虽然是 力扣第一题,但是还是挺难的,也是 代码随想录中 数组,set之后,使用map解决哈希问题的第一题。
建议大家先看视频讲解,然后尝试自己写代码,在看文章讲解,加深印象。
题目链接/文章讲解/视频讲解:代码随想录 (programmercarl.com)
这一道题话,一看到就想到了双指针,感觉就很像那个寻找长度最小的子数组哈哈哈哈哈哈。
这里不要把数组的value和map的value混一起。map的key和value是人为定义的,我们的目的就是把数组的元素值value装到map的key里
map目的用来存放我们访问过的元素,因为遍历数组的时候,需要记录我们之前遍历过哪些元素和对应的下标,这样才能找到与当前元素相匹配的(也就是相加等于target)
这道题要用一个map的结构,为什么嘞。首先我们来分析一下这道题的做法,他有一个target,要找两个数值的话等于这个target,我们就将遍历过的数放进map里面,然后每当遍历一个数值时候,看target-目前的数值在map里面有没有,如果有的话,那就可以直接返回了,因为题目要求返回的是数组的下标,所以说就要用map的value 和 key,因为我们是要查找元素,然后返回下标,所以我们将key作为数组的元素,value作为数组的下标。
class Solution {
public:
vector<int> twoSum(vector<int>& nums, int target) {
std::unordered_map <int,int> map;
for(int i = 0; i < nums.size(); i++) {
// 遍历当前元素,并在map中寻找是否有匹配的key
auto iter = map.find(target - nums[i]);
if(iter != map.end()) {
return {iter->second, i};
}
// 如果没找到匹配对,就把访问过的元素和下标加入到map中
map.insert(pair<int, int>(nums[i], i));
}
return {};
}
};
这道题也让我增加了很多c++的语法知识,在map里面:比如说->first一般就是key,->second就是value,在插入的时候要用pair。
使用pair
的主要原因是,在一些情况下,需要将两个值作为一个单元来处理,例如在将键和值插入到std::map
、std::unordered_map
或类似的关联容器中时。通过使用pair
,可以方便地将这两个值组合在一起,并将其作为一个整体来操作。
还有一个就是auto的类型,如果不知道要用什么类型的话就用这个表示。
注意的点就是,find返回的是一个迭代器。
这里补充一个今日才搞明白的一个小知识
在 C++ 中,使用.
和->
取决于你要访问成员(Member)的类型以及你是通过对象还是指针来访问成员。
-
使用
.
:- 当你有一个对象实例时,你可以使用
.
来访问对象的成员(成员函数或成员变量)。 - 例如:
object.memberFunction();
或object.memberVariable;
- 当你有一个对象实例时,你可以使用
-
使用
->
:- 当你有一个指向对象的指针时,你需要使用
->
来访问对象的成员。 - 例如:
pointer->memberFunction();
或pointer->memberVariable;
注意:迭代器也是一个指针喔!!!
- 当你有一个指向对象的指针时,你需要使用