当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法。
哈希碰撞:1、拉链法:其实拉链法就是要选择适当的哈希表的大小,这样既不会因为数组空值而浪费大量内存,也不会因为链表太长而在查找上浪费太多时间。
2、线性探测法:
例如冲突的位置,放了小李,那么就向下找一个空位放置小王的信息。所以要求tableSize一定要大于dataSize ,要不然哈希表上就没有空置的位置来存放 冲突的数据了。、
class Solution {
public:
bool isAnagram(string s, string t) {
if(s.size()!=t.size()) return false;
vector<int> res(26,0);
for(int i=0;i<s.size();i++){
res[s[i]-'a']++;
}
for(int i=0;i<t.size();i++){
res[t[i]-'a']--;
}
for(int i=0;i<26;i++){
if(res[i]) return false;
}
return true;
}
};
就是判断出现的次数,加上字符串出现次数不多,直接的想法是用哈希表,一遍ac.
进阶: 如果输入字符串包含 unicode 字符怎么办?你能否调整你的解法来应对这种情况?
这里的空间复杂度是O(1),26相比n很小所以是O(1)。
可以考虑练习使用set,如果没有限制数值的大小,就无法使用数组来做哈希表了。看了题解才写的,主要是不熟悉unordered_set的写法。
class Solution {
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
unordered_set<int> res;
vector<int> ans;
for(int i=0;i<nums1.size();i++){
res.insert(nums1[i]);
}
for(int i=0;i<nums2.size();i++){
if(res.find(nums2[i])!=res.end()){
ans.push_back(nums2[i]);
}
}
unordered_set<int> tmp=unordered_set<int>(ans.begin(),ans.end());;
return vector<int>(tmp.begin(),tmp.end());
}
};
题解写法:
class Solution {
public:
vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
unordered_set<int> result_set; // 存放结果,之所以用set是为了给结果集去重
unordered_set<int> nums_set(nums1.begin(), nums1.end());
for (int num : nums2) {
// 发现nums2的元素 在nums_set里又出现过
if (nums_set.find(num) != nums_set.end()) {
result_set.insert(num);
}
}
return vector<int>(result_set.begin(), result_set.end());
}
};
拓展
那有同学可能问了,遇到哈希问题我直接都用set不就得了,用什么数组啊。
直接使用set 不仅占用空间比数组大,而且速度要比数组慢,set把数值映射到key上都要做hash计算的。
不要小瞧 这个耗时,在数据量大的情况,差距是很明显的。
class Solution {
public:
bool isHappy(int n) {
unordered_set<long long> res;
int ans=0;
while(n!=1){
ans=0;
while(n){
int tmp=n%10;
ans+=(tmp*tmp);
n/=10;
}
if(ans==1) return true;
if(res.find(ans)!=res.end()) return false;
res.insert(ans);
n=ans;
}
return true;
}
};
空间复杂度和时间复杂度都是o(logn)
一遍ac。就是结果会循环出现,判断出现出现过的结果,就判断为false,如果出现1就判断为true。
class Solution {
public:
vector<int> twoSum(vector<int>& nums, int target) {
unordered_map<int,int> ans;
for(int i=0;i<nums.size();i++){
if(ans.find(target-nums[i])!=ans.end()){
return {ans[target-nums[i]],i};
}
ans[nums[i]]=i;
// ans.insert(pair<int,int>(nums[i],i));
}
return {};
}
};
看了map的使用方法,一遍ac。只会出现一种情况,想到哈希。知道目标值,和遍历数组的每个数值的情况下,如果需要的另外一个数值已经插入到map中,就返回该数映射的下标和当前下标。
首先我再强调一下 什么时候使用哈希法,当我们需要查询一个元素是否出现过,或者一个元素是否在集合里的时候,就要第一时间想到哈希法。
下面是题解写法:
class Solution {
public:
vector<int> twoSum(vector<int>& nums, int target) {
std::unordered_map <int,int> map;
for(int i = 0; i < nums.size(); i++) {
// 遍历当前元素,并在map中寻找是否有匹配的key
auto iter = map.find(target - nums[i]);
if(iter != map.end()) {
return {iter->second, i};
}
// 如果没找到匹配对,就把访问过的元素和下标加入到map中
map.insert(pair<int, int>(nums[i], i));
}
return {};
}
};
空间复杂度和时间复杂度是O(n)。
map.insert 可以加入pair的数据结构。map.find用来查找元素。