代码随想录day5 哈希表part 01 242.有效的字母异位词 349. 两个数组的交集 202. 快乐数 1. 两数之和-CSDN博客

本文链接：https://blog.csdn.net/qq_42865713/article/details/134792232

当我们遇到了要快速判断一个元素是否出现集合里的时候，就要考虑哈希法。

哈希碰撞：1、拉链法：其实拉链法就是要选择适当的哈希表的大小，这样既不会因为数组空值而浪费大量内存，也不会因为链表太长而在查找上浪费太多时间。

2、线性探测法：

例如冲突的位置，放了小李，那么就向下找一个空位放置小王的信息。所以要求tableSize一定要大于dataSize ，要不然哈希表上就没有空置的位置来存放冲突的数据了。、

class Solution {
public:
    bool isAnagram(string s, string t) {
        if(s.size()!=t.size()) return false;
            vector<int> res(26,0);
            for(int i=0;i<s.size();i++){
                res[s[i]-'a']++;
            }
            for(int i=0;i<t.size();i++){
                res[t[i]-'a']--;
            }
            for(int i=0;i<26;i++){
                if(res[i]) return false;
            }
            return true;
    }
};

就是判断出现的次数，加上字符串出现次数不多，直接的想法是用哈希表，一遍ac.

进阶: 如果输入字符串包含 unicode 字符怎么办？你能否调整你的解法来应对这种情况？

这里的空间复杂度是O（1），26相比n很小所以是O（1）。

可以考虑练习使用set，如果没有限制数值的大小，就无法使用数组来做哈希表了。看了题解才写的，主要是不熟悉unordered_set的写法。

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> res;
        vector<int> ans;
        for(int i=0;i<nums1.size();i++){
            res.insert(nums1[i]);
        }
        for(int i=0;i<nums2.size();i++){
            if(res.find(nums2[i])!=res.end()){
                ans.push_back(nums2[i]);
            }
        }
        unordered_set<int> tmp=unordered_set<int>(ans.begin(),ans.end());;
        return vector<int>(tmp.begin(),tmp.end());
        
    }
};

题解写法：

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重
        unordered_set<int> nums_set(nums1.begin(), nums1.end());
        for (int num : nums2) {
            // 发现nums2的元素 在nums_set里又出现过
            if (nums_set.find(num) != nums_set.end()) {
                result_set.insert(num);
            }
        }
        return vector<int>(result_set.begin(), result_set.end());
    }
};

拓展

那有同学可能问了，遇到哈希问题我直接都用set不就得了，用什么数组啊。

直接使用set 不仅占用空间比数组大，而且速度要比数组慢，set把数值映射到key上都要做hash计算的。

不要小瞧这个耗时，在数据量大的情况，差距是很明显的。

class Solution {
public:
    bool isHappy(int n) {
        unordered_set<long long> res;
        int ans=0;
        while(n!=1){
            ans=0;
            while(n){
                int tmp=n%10;
                ans+=(tmp*tmp);
                n/=10;

            }
            if(ans==1) return true;
            if(res.find(ans)!=res.end()) return  false;
            res.insert(ans);
            n=ans;
            
        }
        return true;
    }
};

空间复杂度和时间复杂度都是o（logn）

一遍ac。就是结果会循环出现，判断出现出现过的结果，就判断为false，如果出现1就判断为true。

class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {
        unordered_map<int,int> ans;
        
        for(int i=0;i<nums.size();i++){
            if(ans.find(target-nums[i])!=ans.end()){
                return {ans[target-nums[i]],i};
            }
            ans[nums[i]]=i;
            // ans.insert(pair<int,int>(nums[i],i));
            
        }
        return {};
    }
};

看了map的使用方法，一遍ac。只会出现一种情况，想到哈希。知道目标值，和遍历数组的每个数值的情况下，如果需要的另外一个数值已经插入到map中，就返回该数映射的下标和当前下标。

首先我再强调一下 什么时候使用哈希法，当我们需要查询一个元素是否出现过，或者一个元素是否在集合里的时候，就要第一时间想到哈希法。

下面是题解写法：

class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {
        std::unordered_map <int,int> map;
        for(int i = 0; i < nums.size(); i++) {
            // 遍历当前元素，并在map中寻找是否有匹配的key
            auto iter = map.find(target - nums[i]); 
            if(iter != map.end()) {
                return {iter->second, i};
            }
            // 如果没找到匹配对，就把访问过的元素和下标加入到map中
            map.insert(pair<int, int>(nums[i], i)); 
        }
        return {};
    }
};

空间复杂度和时间复杂度是O（n）。

map.insert 可以加入pair的数据结构。map.find用来查找元素。