![e1a42459974162ac3027ea650cceacc3.png](https://img-blog.csdnimg.cn/img_convert/e1a42459974162ac3027ea650cceacc3.png)
散列是常用的算法思想之一。
我们先来看两个简单的用空间换时间的策略。
问题:
给出N个正正整数,在给出M个正整数,问这M个数中的每个数分别是否在N个数中出现过,其中。
例如:
N={8,3,7,6,2}
M={7,4,2}
那么M在N中出现的数字只有7和2。
最傻最简单的思路:
M中的每个数都在N中遍历对比一次。
这个想法是可行的,但时间复杂度是完全不能接受的O(NM)。当N和M的数字很多,会非常恐怖,这也违背了算法优化的初衷—快,快,快!
问题已经足够简单,我们可以采用C++标准库中的<map>来解决。
但我不打算这样,我要使用数组来直观的给你演示「什么叫用空间换时间」。
#include <iostream>
using namespace std;
const int maxn=100010;
bool hashTable[maxn]={false};
int main(){
int n,m,x;
cin>>n>>m;
for (int i = 0; i < n; i++)
{
cin>>x;
hashTable[x]=true; //数字x出现过
}
for (int i = 0; i < m; i++)
{
cin>>x;
if (hashTable[x]==true)
{
cout<<"YES"<<endl;
}
else
{
cout<<"NO"<<endl;
}
}
return 0;
}
运行截图:
![f55266b7c548a193c8de0e3a656075d4.png](https://img-blog.csdnimg.cn/img_convert/f55266b7c548a193c8de0e3a656075d4.png)
时间复杂度被大幅减小到O(N+M)。
这正是利用数组高效的查询能力。
我们同样可以基于此,解决M中的数在N中出现的次数。
代码如下:
#include <iostream>
using namespace std;
const int maxn=100010;
int hashTable[maxn]={0};
int main(){
int n,m,x;
cin>>n>>m;
for (int i = 0; i < n; i++)
{
cin>>x;
hashTable[x]++;
}
for (int i = 0; i < m; i++)
{
cin>>x;
cout<<hashTable[x];
}
return 0;
}
这是非常实用的方法,请务必掌握。
这两个简单的栗子很有用,但也有很大局限:
- 数字过大时无能为力
- 输入字符时无能为力
所以,我们需要一个万能的方法。
方法就是散列(hash)。
散列(hash)
散列,简单来说就是「将元素通过一个函数转换为整数,使得该整数可以尽量唯一地代表这个元素」。
散列就相当于一套规则,元素通过这套规则进行存取。
散列函数Hash()就是规则,key就是元素。
Hash(key)就可以得到hash值。
![7ade545678680b71c1b413d5ba8a7ee8.png](https://img-blog.csdnimg.cn/img_convert/7ade545678680b71c1b413d5ba8a7ee8.png)
如果你仍然不太懂,我找到一个很不错的动画,你可以去康康哦!
数据结构微课动画散列查找_哔哩哔哩 (゜-゜)つロ 干杯~-bilibiliwww.bilibili.com![e6de202199071fd60f00b40af053e65e.png](https://img-blog.csdnimg.cn/img_convert/e6de202199071fd60f00b40af053e65e.png)
了解了的大概的思想,我们用一个字符串hash栗子来结束。
问题:
给出N个字符串(由恰好三位大写字母组成),再给出M个查询字符串,问二秘阁查询字符串在N个字符串中出现的次数。
#include <iostream>
using namespace std;
const int maxn=100;
char s[maxn][5],temp[5];
int HashTable[26*26*26+10];
int HashFunc(char s[],int len){
int id=0;
for (int i = 0; i < len; i++)
{
id=id*26+(s[i]-'A');
}
return id;
}
int main(){
int n,m;
cin>>n>>m;
for (int i = 0; i < n; i++)
{
cin>>s[i];
int id=HashFunc(s[i],3);//将字符串s[i]转换为整数
HashTable[id]++; //该字符串的出现次数加1
}
for (int i = 0; i < m; i++)
{
cin>>temp;
int id=HashFunc(temp,3); //将字符串temp转换为整数
cout<<HashTable[id]; //输出该字符串的出现次数
}
return 0;
}
以后如果想到用hash解决,请直接使用C++标准库模板库中的<map>来解决。
Nice!Nice!Nice!
![d7b7ca7fdf83966e2f56c87b52661998.png](https://img-blog.csdnimg.cn/img_convert/d7b7ca7fdf83966e2f56c87b52661998.png)