一 哈希表理论基础
一般哈希表都是用来快速判断一个元素是否出现集合里,本质上是以空间换时间。一般常用的数据结构是数组、集合(set)、映射(map)。
- 对数组来讲,数组的大小是受限制的,一般只能存储有限范围内的元素,比如数字0到9,字母a到z,而且如果元素很少而哈希值太大会造成内存空间的浪费。
- 对于集合来讲,set里面放的元素只能是一个key,set又分为set、multiset、unordered_set。set 和multiset 的底层实现是红黑树,key值是有序的,但key不可以修改,只能删除和增加,二者区别在于set中元素不可重复,而multiset中元素可以重复。unordered_set底层实现为哈希表,key值是无序的,且元素不可重复,其查询和增删效率更优秀。因此使用集合来解决哈希问题的时候,优先使用unordered_set,因为它的查询和增删效率是最优的,如果需要集合是有序的,那么就用set,如果要求不仅有序还要有重复数据的话,那么就用multiset。
- 对于映射来讲,map里面放的元素是一个键值对pair,map又分为map、multimap、unordered_map。map 和multimap 的底层实现是红黑树,key是有序的,key不可以修改,只能删除和增加,map中key不可重复,而multimap中key可以重复。unordered_map底层实现为哈希表,key值是无序的,且key不可重复,其查询和增删效率更优秀。
二 242 有效的字母异位词
只需要判定字母a到字母z,用数组即可。
class Solution {
public:
bool isAnagram(string s, string t) {
int record[26] = {0};
for (int i = 0; i < s.size(); i++) {
record[s[i] - 'a']++;
}
for (int i = 0; i < t.size(); i++) {
record[t[i] - 'a']--;
}
for (int i = 0; i < 26; i++) {
if (record[i] != 0) {
return false;
}
}
return true;
}
};
三 349 两个数组的交集
-
在c++11里,for循环中可以自动迭代:实现了对于vector型内容打印。本题因为输出元素是唯一的,且不考虑顺序,选择unordered_set,当然由于数据大小有限制,也可以使用数组,但不具有普遍性。
class Solution { public: vector<int> intersection(vector<int>& nums1, vector<int>& nums2) { // 用于存放结果,用set是为了给结果集去重 unordered_set<int> result_set; //初始化,用nums中的元素 unordered_set<int> nums_set(nums1.begin(), nums1.end()); for (int num : nums2) { //如果没找到,则返回一个指向容器中最后一个元素之后位置的迭代器,即end() if (nums_set.find(num) != nums_set.end()) { result_set.insert(num); } } //将set<int>转化为vector<int> return vector<int>(result_set.begin(), result_set.end()); } };
四 202 快乐数
如何判定一个数不可能是快乐数呢,那就是每个位置上的数字的平方和的这个数已经出现过了,那就必定不可能是快乐数。这要求哈希表中的元素是唯一的,且不需要考虑顺序,选择unordered_set
class Solution {
public:
int getSum(int n) {
int sum = 0;
while (n) {
sum += (n % 10) * (n % 10);
n /= 10;
}
return sum;
}
bool isHappy(int n) {
unordered_set<int> set;
while(1){
int sum = getSum(n);
if (sum == 1) {
return true;
}
//出现过 就不可能是快乐数
if (set.find(sum) != set.end()) {
return false;
} else {
set.insert(sum);
}
n = sum;
}
}
};
五 1 两数之和
本题,我们不仅要知道元素有没有遍历过,还要知道这个元素对应的下标,需要使用 key value结构来存放,key来存元素,value来存下标,那么使用map正合适。本题要求key值唯一,且不需要考虑顺序,选择unordered_map 效率更高。
class Solution {
public:
vector<int> twoSum(vector<int>& nums, int target) {
unordered_map <int,int> map;
for(int i = 0; i < nums.size(); i++) {
// 遍历当前元素,并在map中寻找是否有匹配的key
//iter->second返回pair中第二个值
auto iter = map.find(target - nums[i]);
if(iter != map.end()) {
return {iter->second, i};
}
// 如果没找到匹配对,就把访问过的元素和下标加入到map中
map.insert(pair<int, int>(nums[i], i));
}
//不存在
return {};
}
};
六 总结
- 要分清数组、集合(set)、映射(map)的选择时机
- 在c++11里,for循环中可以自动迭代,从而实现了对于vector数组内容的打印
- 对于map.find或者map.start的返回值应该使用auto 自动类型推导
- pair键值对中第一个元素是 it->first,第二个则为it->second