给定一个字符串,其中含有不同的字母数量为m,现在求这个字符串中有多少个长度为n且长的互不相同的字符子串
举个例子, n=3, m=4 ,字符串 "daababac". 长度为3的不同的子串分别是: "daa"; "aab"; "aba"; "bab"; "bac". 因此, 答案是5.
Input
第一行是两个整数n,m,,一个空格隔开。 接下来一行是我们要解决的字符串.( 你可以认为字符串的长度不会超过一千六百万。)Orz我读错题了,并不是字符串长度不超过1600万,是合理hash之后的hash的值不超过1600万。Orz原谅我
Output
程序应该输出一个整数,对应于给定文本中所找到的大小为n的不同子字符串的数量。
输入数据
3 4 daababac
输出数据
5
Hint
输入数据量庞大,推荐使用scanf
#include<iostream>
#include<cstring>
#include<algorithm>
#include<stdio.h>
using namespace std;
typedef unsigned long long ull;
const int M=2e6;
char str[M];
ull has[M],a[M],has2[M];
int len;
void init_hash(){
memset(has,0,sizeof(has));
memset(a,0,sizeof(a));
int p=223;
a[0]=1;
for(int i=1;i<M;i++){
a[i]=a[i-1]*p;//p的个数
}
for(int i=1;i<=len;i++){
has[i]=(has[i-1]*p+(str[i]-'a'+1));//前i位(包括i)对应的整数
}
}
int main()
{
int n,nc;
cin>>n>>nc;
scanf("%s",str+1);
len=strlen(str+1);
init_hash();
int k=0;
memset(has2,0,sizeof(has2));
for(int i=1;i<=len-n+1;i++){
has2[k]=has[i+n-1]-has[i-1]*a[n];
k++;
}
sort(has2,has2+k);
k=unique(has2,has2+k)-has2;
printf("%d\n",k);
return 0;
}