代码随想录算法训练营第五天|242.有效的字母异位词 349.两个数组的交集 第202题. 快乐数

哈希表理论基础

大家要了解哈希表的内部实现原理,哈希函数,哈希碰撞,以及常见哈希表的区别

什么时候想到用哈希法,当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法  这句话很重要,大家在做哈希表题目都要思考这句话。 

首先什么是 哈希表,哈希表(英文名字为Hash table,国内也有一些算法书籍翻译为散列表,大家看到这两个名称知道都是指hash table就可以了)。

哈希表是根据关键码的值而直接进行访问的数据结构。

这么官方的解释可能有点懵,其实直白来讲其实数组就是一张哈希表。

哈希表中关键码就是数组的索引下标,然后通过下标直接访问数组中的元素,如下图所示:

那么哈希表能解决什么问题呢,一般哈希表都是用来快速判断一个元素是否出现集合里。

例如要查询一个名字是否在这所学校里。

我们只需要初始化把这所学校里学生的名字都存在哈希表里,在查询的时候通过索引直接就可以知道这位同学在不在这所学校里了。

将学生姓名映射到哈希表上就涉及到了hash function ,也就是哈希函数

哈希函数

哈希函数,把学生的姓名直接映射为哈希表上的索引,然后就可以通过查询索引下标快速知道这位同学是否在这所学校里了。

哈希表我们刚刚说过,就是一个数组。

如果学生的数量大于哈希表的大小怎么办,此时就算哈希函数计算的再均匀,也避免不了会有几位学生的名字同时映射到哈希表 同一个索引下标的位置。

接下来哈希碰撞登场

一般哈希碰撞有两种解决方法,拉链法和线性探测法。

拉链法

其实拉链法就是要选择适当的哈希表的大小,这样既不会因为数组空值而浪费大量内存,也不会因为链表太长而在查找上浪费太多时间。

线性探测法

使用线性探测法,一定要保证tableSize大于dataSize 我们需要依靠哈希表中的空位来解决碰撞问题。

例如冲突的位置,放了小李,那么就向下找一个空位放置小王的信息。所以要求tableSize一定要大于dataSize ,要不然哈希表上就没有空置的位置来存放 冲突的数据了。如图所示

常见的三种哈希结构

当我们想使用哈希法来解决问题的时候,我们一般会选择如下三种数据结构。

  • 数组
  • set (集合)
  • map(映射)

C++中,set map 分别提供以下三种数据结构,其底层实现以及优劣如下表所示:

当我们要使用集合来解决哈希问题的时候,优先使用unordered_set,因为它的查询和增删效率是最优的,如果需要集合是有序的,那么就用set,如果要求不仅有序还要有重复数据的话,那么就用multiset

总结一下,当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法

但是哈希法也是牺牲了空间换取了时间,因为我们要使用额外的数组,set或者是map来存放数据,才能实现快速的查找。

242.有效的字母异位词

这道题目,大家可以感受到 数组 用来做哈希表 给我们带来的便利之处。

题目:给定两个字符串 s  t ,编写一个函数来判断 t 是否是 s 的字母异位词。

注意: s  t 中每个字符出现的次数都相同,则称 s  t 互为字母异位词。

思路

数组其实就是一个简单哈希表,而且这道题目中字符串只有小写字符,那么就可以定义一个数组,来记录字符串s里字符出现的次数。

需要定义一个多大的数组呢,定一个数组叫做record,大小为26 就可以了,初始化为0

为了方便举例,判断一下字符串s= "aee", t = "eae"

操作动画如下:

https://code-thinking.cdn.bcebos.com/gifs/242.%E6%9C%89%E6%95%88%E7%9A%84%E5%AD%97%E6%AF%8D%E5%BC%82%E4%BD%8D%E8%AF%8D.gif

定义一个数组叫做record用来上记录字符串s里字符出现的次数。

需要把字符映射到数组也就是哈希表的索引下标上,因为字符a到字符zASCII26个连续的数值,所以字符a映射为下标0,相应的字符z映射为下标25

再遍历字符串s, 只需要将 s[i] - ‘a’ 所在的元素做+1操作即可,这样就将字符串s中字符出现的次数,统计出来了。那如何检查字符串t中是否出现了这些字符,同样在遍历字符串t的时候,对t中出现的字符映射哈希表索引上的数值再做-1的操作。

那么最后检查一下,record数组如果有的元素不为零0,说明字符串st一定是谁多了字符或者谁少了字符,return false

最后如果record数组所有元素都为零0,说明字符串st是字母异位词,return true

C代码如下:

bool isAnagram(char* s, char* t) {

    int record[26] ={0};

    int lenS=strlen(s);

    int lenT=strlen(t);

    //遍历数组s,统计s中每个字母出现的次数

    for(int i=0;i<lenS;i++){

        record[s[i]-'a']++;

    }

    //遍历数组t

    for(int i=0;i<lenT;i++){

        record[t[i]-'a']--;

    }

    //检查record最后是否为全0数组

    for(int i=0;i<26;i++){

        if(record[i]!=0){

            return false;

        }

    }

    return true;

   

}

注意点:如何统计字符串中每个字母出现的次数?

349.两个数组的交集

本题就开始需要考虑 什么时候用set 什么时候用数组

题目:给定两个数组 nums1  nums2 ,返回 它们的交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序 

思路

当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法了。这道题很明显的哈希表题目,用一个哈希表映射第一个数组,再查找第二个数组,如果已经存在就放在结果数组中,注意结果是去重的。

再来看看哈希表的选择。直接使用set不仅占用空间比数组大,而且速度要比数组慢,set把数值映射到key上都要做hash计算的,因此优先使用数组。但是,使用数组来做哈希的题目,是因为题目都限制了数值的大小。但如果哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。因为题目限制数值最多为 1000,所以这道题可以用数组。

C代码如下:

int* intersection(int* nums1, int nums1Size, int* nums2, int nums2Size, int* returnSize) {

    //创建结果数组保存交集元素

    int* result=malloc(sizeof(int)*fmin(nums1Size,nums2Size));

    //创建哈希表

    int hash[1001]={0};

    //计算 nums1 数组出现了哪些数字,出现即为1

    for(int i =0;i<nums1Size;i++){

        hash[nums1[i]]=1;

    }

    //检查 nums2 中的值是否存在于 nums1 计数数组中

    int resultSize=0;

    for(int i=0;i<nums2Size;i++){

        if(hash[nums2[i]]==1){

            result[resultSize++]=nums2[i];

            //清除此计数以避免重复值

            hash[nums2[i]]=0;

        }

    }

    *returnSize=resultSize;

    return result;

}

202. 快乐数

题目: 编写一个算法来判断一个数 n 是不是快乐数。

「快乐数」定义为:对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和,然后重复这个过程直到这个数变为 1,也可能是 无限循环 但始终变不到 1。如果 可以变为  1,那么这个数就是快乐数。

如果 n 是快乐数就返回 True ;不是,则返回 False

思路

先理解题目要求,这道题的要点一共有两个:

1.做完某次计算后等于1return true,不必多说。

2.在计算的过程中无限循环始终不变为 1,也就是说,它的计算结果 sum 会重复出现,这是本题的关键,若在循环的过程中 sum 重复出现,说明它永远不可能等于 1return false

3.理解了以上两点再来看就比较简单了,当我们遇到了要快速判断一个元素是否出现集合里的时候,就要考虑哈希法了。在本题中,使用数组作为哈希表用来存放每次计算的结果,初始数组都为 0,每次计算后将结果作为下标映射到数组元素。若对应数组元素为0,说明此结果没得到过,将其改为 1;若已经为 1,说明计算结果已经重复,return false

4. 那么数组的大小怎么确定呢?题目中告诉了 n 的大小最大不超过 2^31-1即最大不超过 10 位数,也就是说,计算的结果最大不超过 9^2*10 也就是 810,我们设的再稍微大一点,所以是820,这也是为什么本题能用数组的原因

  • 注意,使用数组来做哈希的题目,是因为题目都限制了数值的大小。而且如果哈希值比较少、特别分散、跨度非常大,使用数组就造成空间的极大浪费。

C代码如下:

bool isHappy(int n) {

    //计算每个位的数字平方之和

    int getSum(int n){

        int sum=0;

        while(n){

            sum+=(n%10)*(n%10);

            n/=10;

        }

        return sum;

    }

    int sum=getSum(n);

    //创建哈希表

    int hash[820]={0};

    while(sum!=1){

        if(hash[sum]==1){

            return false;

        }

        else{

            hash[sum]++;

        }

        //更新sum

        sum=getSum(sum);

    }

    return true;

      

}

注意点:1.为什么哈希表的大小设为820

        2.如何计算数字各位上的平方和

        3.while循环条件是什么

写在最后:今天是第一次做哈希表有关的题目,感觉挺新奇的,哈希表的作用挺强大的。但是只掌握了数组作为哈希表的用法.关键是要知道哈希表的大小设为多少.setmap都还不会.

  • 17
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值