题目大意:
给你一个串,让你统计有多少个子串出现了恰好k次,可重复的子串。
分析:
第一道后缀数组的题目。
我们先求出sa数组和,height数组,然后我们不难发现,我们需要枚举区间k,在[i,i+k-1]这个区间里面去求sa[i,i+k-1]的最长公共前缀,这样就求出来了至少出现k次的子串,然后我们需要去减去至少出现k+1次的子串,所以要减去[i-1,i+k-1]和[i,i+k]的,但是这样又把[i-1,i-k]的减多了一次,在加上即可。
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <vector>
#include <set>
#include <stack>
using namespace std;
const int maxn = 1e5 + 10;
char s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn];
void build_sa(int m,int n)
{
int i,*x=t,*y=t2;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[i]=s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(int i=n-k;i<n;i++) y[p++]=i;
for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=0;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;
x[sa[0]]=0;
for(int i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if(p>=n) break;
m=p;
}
}
int ran[maxn],height[maxn];
void getheight(int n)
{
//cout<<111<<endl;
int i,j,k=0;
for(i=0;i<=n;i++) ran[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k) k--;
j=sa[ran[i]-1];
while(s[i+k]==s[j+k]) k++;
height[ran[i]]=k;
}
}
int d[maxn][20];
int n;
void rmq_init(int *A)
{
for(int i=0;i<n;i++) d[i][0]=A[i];
for(int j=1;(1<<j)<=n;j++)
{
for(int i=0;i+(1<<j)-1<n;i++)
{
d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
}
}
int rmq(int L,int R)
{
int k=0;
while((1<<(k+1))<=R-L+1) k++;
return min(d[L][k],d[R-(1<<k)+1][k]);
}
int query_rmq(int l,int r)
{
if(l==r) return n-sa[l];
return rmq(l+1,r);
}
int main()
{
int T;
scanf("%d",&T);
while(T--)
{
int k;
scanf("%d",&k);
scanf("%s",s);
n=strlen(s);
build_sa(200,n+1);
getheight(n);
for(int i=1;i<=n;i++)
{
height[i-1]=height[i];
}
for(int i=0;i<n;i++)
{
sa[i]=sa[i+1];
//cout<<sa[i]<<endl;
}
int ans=0;
rmq_init(height);
// cout<<rmq(0,1)<<"...."<<endl;
for(int i=0;i<n;i++)
{
int j=i+k-1;
if(j>=n) break;
ans+=query_rmq(i,j);
// cout<<ans<<" 111"<<endl;
if(i-1>=0) ans-=query_rmq(i-1,j);
//cout<<ans<<" 222"<<endl;
if(j+1<n) ans-=query_rmq(i,j+1);
// cout<<ans<<" 333"<<endl;
if(i-1>=0&&j+1<n) ans+=query_rmq(i-1,j+1);
// cout<<ans<<endl;
}
printf("%d\n",ans);
}
return 0;
}