字符串 hash 唯一数字_#图解 算法初步:散列(hash)

e1a42459974162ac3027ea650cceacc3.png

散列是常用的算法思想之一。

我们先来看两个简单的用空间换时间的策略。


问题:

给出N个正正整数,在给出M个正整数,问这M个数中的每个数分别是否在N个数中出现过,其中

例如:

N={8,3,7,6,2}

M={7,4,2}

那么M在N中出现的数字只有7和2。

最傻最简单的思路:

M中的每个数都在N中遍历对比一次。

这个想法是可行的,但时间复杂度是完全不能接受的O(NM)。当N和M的数字很多,会非常恐怖,这也违背了算法优化的初衷—快,快,快

问题已经足够简单,我们可以采用C++标准库中的<map>来解决。

但我不打算这样,我要使用数组来直观的给你演示「什么叫用空间换时间」。

#include <iostream>
using namespace std;

const int maxn=100010;

bool hashTable[maxn]={false};

int main(){

    int n,m,x;
    cin>>n>>m;
    for (int i = 0; i < n; i++)
    {
        cin>>x;
        hashTable[x]=true; //数字x出现过
    }

    for (int i = 0; i < m; i++)
    {
        cin>>x;
        if (hashTable[x]==true)
        {
            cout<<"YES"<<endl;
        }
        else
        {
            cout<<"NO"<<endl;
        }
        
    }

    return 0;
    
}

运行截图:

f55266b7c548a193c8de0e3a656075d4.png

时间复杂度被大幅减小到O(N+M)

这正是利用数组高效的查询能力。

我们同样可以基于此,解决M中的数在N中出现的次数

代码如下:

#include <iostream>
using namespace std;

const int maxn=100010;

int hashTable[maxn]={0};
int main(){

    int n,m,x;
    cin>>n>>m;
    for (int i = 0; i < n; i++)
    {
        cin>>x;
        hashTable[x]++;
    }

    for (int i = 0; i < m; i++)
    {
        cin>>x;
        cout<<hashTable[x];
    }
    
    
    return 0;
}

这是非常实用的方法,请务必掌握。

这两个简单的栗子很有用,但也有很大局限:

  1. 数字过大时无能为力
  2. 输入字符时无能为力

所以,我们需要一个万能的方法。

方法就是散列(hash)。


散列(hash)

散列,简单来说就是「将元素通过一个函数转换为整数,使得该整数可以尽量唯一地代表这个元素」。

散列就相当于一套规则,元素通过这套规则进行存取。

散列函数Hash()就是规则,key就是元素。

Hash(key)就可以得到hash值。

7ade545678680b71c1b413d5ba8a7ee8.png
hash值

如果你仍然不太懂,我找到一个很不错的动画,你可以去康康哦!

数据结构微课动画散列查找_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili​www.bilibili.com
e6de202199071fd60f00b40af053e65e.png

了解了的大概的思想,我们用一个字符串hash栗子来结束。

问题:

给出N个字符串(由恰好三位大写字母组成),再给出M个查询字符串,问二秘阁查询字符串在N个字符串中出现的次数。
#include <iostream>
using namespace std;

const int maxn=100;
char s[maxn][5],temp[5];

int HashTable[26*26*26+10];

int HashFunc(char s[],int len){
    int id=0;
    for (int i = 0; i < len; i++)
    {
        id=id*26+(s[i]-'A');
    }
    return id;
}

int main(){

    int n,m;
    cin>>n>>m;
    for (int i = 0; i < n; i++)
    {
        cin>>s[i];
        int id=HashFunc(s[i],3);//将字符串s[i]转换为整数
        HashTable[id]++; //该字符串的出现次数加1
    }

    for (int i = 0; i < m; i++)
    {
        cin>>temp;
        int id=HashFunc(temp,3); //将字符串temp转换为整数
        cout<<HashTable[id]; //输出该字符串的出现次数
    }

    return 0;
}

以后如果想到用hash解决,请直接使用C++标准库模板库中的<map>来解决。


Nice!Nice!Nice!

d7b7ca7fdf83966e2f56c87b52661998.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值