题目大意就是将一个字符串分成长度为N的字串。且不同的字符不会超过NC个。问总共有多少个不同的子串?
采用的办法就是以nc作为进制,把一个子串化为这个进制下的数,再用哈希判断。由于题目说长度不会超过16,000,000 所以哈希长度就设为16000000就行。另外为每一个字符对应一个整数,来方便转化。
题解 : 先计算出前3个字符的哈希值,然后记录,减去第一个字符的哈希值,再加上后边一个字符的哈希值,记录,从n遍历到len-n。
代码如下:
#include<stdio.h>
#include<string.h>
const int N=1e7+10;
char s[N];
int f[256];
bool v[N];
int main()
{
int n,m;
while(~scanf("%d%d%s",&n,&m,s))
{
int len=strlen(s);
memset(f,0,sizeof(f));
memset(v,0,sizeof(v));
int x=0;
for(int i=0;i<len;i++)
if(!f[s[i]]) f[s[i]]=x++; //对出现的字母赋予映射值
int pow=1,sum=0;
for(int i=1;i<n;i++) pow*=m; // 计算base的阶乘
for(int i=0;i<n;i++) sum=sum*m+f[s[i]]; //前3位的hash值
int res=0;
if(!v[sum])
{
v[sum]=1;
res++;
} //记录前三位为一种
for(int i=n;i<len;i++)
{
sum-=f[s[i-n]]*pow; //减去第一位 // hash(l,r)=hash(r)-hash(l-1)*base^(r-l+1)
sum=sum*m+f[s[i]]; //再加一位 // 2 3 3 1 p 2
if(!v[sum])
{ // hash(l-1) 就是单1位的值 = f[s[i-n]
res++;
v[sum]=1;
}
}
printf("%d\n",res);
}
return 0;
}