给定一个字符串,其中含有不同的字母数量为m,现在求这个字符串中有多少个长度为n且长的互不相同的字符子串
举个例子, n=3, m=4 ,字符串 "daababac". 长度为3的不同的子串分别是: "daa"; "aab"; "aba"; "bab"; "bac". 因此, 答案是5.
Input
第一行是两个整数n,m,,一个空格隔开。 接下来一行是我们要解决的字符串.( 你可以认为字符串的长度不会超过一千六百万。)Orz我读错题了,并不是字符串长度不超过1600万,是合理hash之后的hash的值不超过1600万。Orz原谅我
Output
程序应该输出一个整数,对应于给定文本中所找到的大小为n的不同子字符串的数量。
输入数据
3 4 daababac
输出数据
5
Hint
输入数据量庞大,推荐使用scanf
#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
const int maxm = 1e7 + 6e6 + 5;
char s[maxm];
int ascii[300];
int hash[maxm];
int main()
{
int i,j,n,m;
scanf("%d %d",&n,&m);
scanf("%s",s);
int len = strlen(s);
memset(ascii,0,sizeof(ascii));
memset(hash,0,sizeof(hash));
int num = 0;
for (i=0;i<len;i++)
if (!ascii[s[i]])
ascii[s[i]] = ++num;//将字符转化成数字代替
int cnt = 0;
for (i=0;i<len-n+1;i++)
{
int sum = 0;//这个换成1都RE了
for (j=i;j<i+n;j++)
{
sum += sum * m + ascii[s[j]];
}
if (!hash[sum])
{
cnt++;
hash[sum] = 1;
}
}
printf("%d\n",cnt);
return 0;
}