题目
哈希:
按一定的规则把字符串转换为数字,使不同的字符串对应不同的数值;
题意:
给定一个字符串,其中含有不同的字母数量为m,现在求这个字符串中有多少个长度为n且长的互不相同的字符子串 。举个例子, n=3, m=4 ,字符串 "daababac". 长度为3的不同的子串分别是: "daa"; "aab"; "aba"; "bab"; "bac". 因此, 答案是5.用set会超时。
思路:
不同字母的个数为m,单个字符的值为在字符串中第一次出现的循序,(比如bbac,b=1,a=2,c=3),然后按m进制转换成数值。因为字符数值最大不会超过m,而且又是按m进制转换而成的,所以每个字符串对应的数字都不会一样,所以不会出现哈希冲突。
#include<iostream>
#include<cstring>
#define maxn 10000006
using namespace std;
bool vis[maxn];
int val[300];
int main()
{
ios::sync_with_stdio(false);
int n,m,tot=0;
cin>>n>>m;
string s;
cin>>s;
memset(vis,false,sizeof(vis));
memset(val,0,sizeof(val));
for(int i=0;s[i]!='\0';i++)
{
if(!val[s[i]])
val[s[i]]=++tot;
if(tot==m) break;
}
int ans=0;
for(int i=0;i+n<=s.size();i++)
{
int sum=0;
for(int j=0;j<n;j++)
sum=sum*m+val[s[i+j]];
if(!vis[sum])
{
vis[sum]=true;
ans++;
}
}
cout<<ans<<endl;
return 0;
}