LeetCode刷题打卡|day6 哈希表

saufmoi

已于 2023-03-08 20:53:19 修改

阅读量144

点赞数

文章标签：算法 leetcode 数据结构 Powered by 金山文档

于 2023-03-07 21:31:05 首次发布

本文链接：https://blog.csdn.net/saufmoi/article/details/129387470

版权

哈希表是一种直接通过关键码访问的数据结构，常用于快速判断元素是否存在于集合中。哈希函数将键转换为索引，可能出现哈希碰撞。解决碰撞的方法包括拉链法和线性探测法。std::unordered_set等容器底层即使用哈希表，而std::set和std::map利用红黑树实现有序存储。文章还举例说明了哈希表在解决字母异位词、集合交集和快乐数等问题中的应用。

摘要由CSDN通过智能技术生成

哈希表：根据关键码的值而直接进行访问的数据结构；直白的说就是数组就是一张哈希表；哈希表中关键码就是数组的索引下标，然后通过下标直接访问数组中的元素。

哈希表能解决的问题：用来快速判断一个元素是否出现在集合里。

哈希函数：将学生姓名直接映射为哈希表上的索引，然后通过查询索引下标快速知道这位同学是否在这个这所学校里；通过hashCode把名字转化为数值，一般hashcode是通过特定编码方式，可以将其他数据格式转化为不同的数值，这样就把学生名字映射为哈希表上的索引数字了。

哈希碰撞

hashcode得到的数值大于哈希表的大小，也就是大于tablesize，出现哈希碰撞；

解决方法：

拉链法：将发生冲突的元素都存在链表中

(数据规模是datasize，哈希表大小为tablesize)

线性探测法：使用线性探测法一定要保证tablesize大于datasize，需要依靠哈希表中的空位来解决碰撞问题。

常用的三种哈希结构

数组、set（集合）、map（映射）

数组做哈希法的局限：数组的大小是受限制的，而且如果元素很少，而哈希值太大会造成内存空间的浪费；

std::unordered_set底层实现为哈希表，std::set 和std::multiset 的底层实现是红黑树，红黑树是一种平衡二叉搜索树，所以key值是有序的，但key不可以修改，改动key值会导致整棵树的错乱，所以只能删除和增加。

set做哈希法的局限：set是一个集合，里面只能存放一个key

map是一种可key、value存储结构

std::unordered_map 底层实现为哈希表，std::map 和std::multimap 的底层实现是红黑树。同理，std::map 和std::multimap 的key也是有序的（这个问题也经常作为面试题，考察对语言容器底层的理解）。

当我们要使用集合来解决哈希问题的时候，优先使用unordered_set，因为它的查询和增删效率是最优的，如果需要集合是有序的，那么就用set，如果要求不仅有序还要有重复数据的话，那么就用multiset。

242. 有效的字母异位词 - 力扣（LeetCode）

哈希法

class Solution {
public:
    bool isAnagram(string s, string t) {
        int recode[26]={0};
        for(int i = 0; i<s.size();i++){
            recode[s[i] - 'a']++;//统计出字母出现的频次
        }
        for(int i = 0 ; i<t.size();i++){
            recode[t[i] - 'a']--;//在原先哈希数组的基础上对字母频次进行减的操作
        }
        for(int i = 0; i<26; i++)
        {
            if(recode[i]!=0)
            {
                return false;
            }
        }
        return true;
    }
};

相关题目

383.赎金信(opens new window)

49.字母异位词分组

438.找到字符串中所有字母异位词

349. 两个数组的交集 - 力扣（LeetCode）

用set数据结构

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重
        unordered_set<int> num_sets(nums1.begin(), nums1.end());
        for(int num:nums2){
            if(num_sets.find(num)!=num_sets.end()){
                result_set.insert(num);
            }
        }
        return vector<int>(result_set.begin(), result_set.end());
    }
};

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重
        int hash[1005] = {0}; // 默认数值为0
        for (int num : nums1) { // nums1中出现的字母在hash数组中做记录
            hash[num] = 1;
        }
        for (int num : nums2) { // nums2中出现话，result记录
            if (hash[num] == 1) {
                result_set.insert(num);
            }
        }
        return vector<int>(result_set.begin(), result_set.end());
    }
};

202. 快乐数 - 力扣（LeetCode）

class Solution {
public:
    int getsum(int n){
        int sum = 0;
        while(n){
            sum += (n%10)*(n%10);
            n /=10;
        }
        return sum;
    }
    bool isHappy(int n) {
        unordered_set<int> set;
        while(1){
            int sum = getsum(n);
            if(sum == 1){
                return true;
            }
            //判断sum是否重复出现
            if(set.find(sum) != set.end()){
                return false;
            }else{
                set.insert(sum);
            }
            n = sum;
        }
    }
};

1. 两数之和 - 力扣（LeetCode）

寻找元素和下标，使用哈希法中的map结构；查找的数值为元素，所以key=元素，value=下标；

map在此题中的作用：存放遍历过的元素。

暴力解法

class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {
        for(int i =0; i<nums.size()-1;i++){
            for(int j = i+1;j<nums.size();j++){
                if(nums[i]+nums[j]==target){
                    return {i,j};
                }
            }
        }
        return {};
    }   
};

哈希法

需要明确两点：

map用来做什么

map中key和value分别表示什么

map目的用来存放我们访问过的元素，因为遍历数组的时候，需要记录我们之前遍历过哪些元素和对应的下标，这样才能找到与当前元素相匹配的（也就是相加等于target）

接下来是map中key和value分别表示什么。

这道题我们需要给出一个元素，判断这个元素是否出现过，如果出现过，返回这个元素的下标。

那么判断元素是否出现，这个元素就要作为key，所以数组中的元素作为key，有key对应的就是value，value用来存下标。

所以 map中的存储结构为 {key：数据元素，value：数组元素对应的下标}。

在遍历数组的时候，只需要向map去查询是否有和目前遍历元素比配的数值，如果有，就找到的匹配对，如果没有，就把目前遍历的元素放进map中，因为map存放的就是我们访问过的元素。

class Solution {
public:
    vector<int> twoSum(vector<int>& nums, int target) {
        std::unordered_map <int, int> map;
        for(int i =0; i<nums.size();i++){
            //遍历当前元素，并在map中寻找是否有匹配的key
            auto iter = map.find(target-nums[i]);
            if(iter != map.end()){
                return {iter->second,i};
            }
            //如果没找到匹配对，就把访问过的元素和下标加入到map中
            map.insert(pair<int, int>(nums[i],i));
        }
        return {};
    }   
};