给定一个字符串,其中含有不同的字母数量为m,现在求这个字符串中有多少个长度为n且长的互不相同的字符子串
举个例子, n=3, m=4 ,字符串 "daababac". 长度为3的不同的子串分别是: "daa"; "aab"; "aba"; "bab"; "bac". 因此, 答案是5.
Input
第一行是两个整数n,m,,一个空格隔开。 接下来一行是我们要解决的字符串.( 你可以认为字符串的长度不会超过一千六百万。)Orz我读错题了,并不是字符串长度不超过1600万,是合理hash之后的hash的值不超过1600万。Orz原谅我
Output
程序应该输出一个整数,对应于给定文本中所找到的大小为n的不同子字符串的数量。
输入数据
3 4
daababac
输出数据
5
Hint
输入数据量庞大,推荐使用scanf
哈希算法模板题
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
typedef long long ll;
const int MAXN = 16000005;
bool vis[MAXN];
char str[MAXN];
int id[128];
int n,m;
int main(){
while(~scanf("%d %d",&n,&m)){
scanf("%s",str+1);
int len=strlen(str+1);
memset(vis,0,sizeof(vis));
memset(id,0,sizeof(id));
ll ans=0;
int s=0;
ll sum=0;
for(int i=1;i<=len;i++){
if(id[str[i]]==0) id[str[i]]=++s;
if(s==m) break;
}
for(int i=1;i<=len-n+1;i++){
sum=0;
for(int j=i;j<=i+n-1&&j<=len;j++){
sum=sum*m+id[str[j]];
}
if(vis[sum]==0){
ans++;
vis[sum]=1;
}
}
printf("%lld\n",ans);
}
return 0;
}