Description
给出一个字符串 s s ,定义的子串中恰好出现 k k 次的子串为重要子串,问的重要子串个数
Input
第一行一整数 T T 表示用例组数,每组用例首先输入一整数,之后输入一字符串 s s
Output
输出 s s 的重要子串个数
Sample Input
2
2
abcabc
3
abcabcabcabc
Sample Output
6
9
Solution
子串是后缀的前缀,相同的子串必然为字典序相邻后缀的公共前缀,故先跑一边后缀数组得到数组, height[i] h e i g h t [ i ] 表示字典序第 i−1 i − 1 小的后缀和第 i i 小的后缀的最长公共前缀长度
时,考虑字典序第 i i 小的后缀到字典序第小的后缀,这 k k 个后缀的公共前缀长度为,公共前缀的前 x x 个前缀即为在中出现至少 k k 次的子串,但是注意到要出现恰好次,故这 x x 个前缀并不都合法,其中是字典序第小的后缀和字典序第 i+k i + k 小的后缀的前缀的前缀是不合法的,故答案为 x−max(height[i],height[i+k]) x − m a x ( h e i g h t [ i ] , h e i g h t [ i + k ] )
k=1 k = 1 时,问题即转化为在 s s 中恰好出现一次的子串数量,也即总后缀数减去在 s s 中重复出现的子串数,对于字典序第小的后缀,其不合法前缀即为和字典序第 i−1 i − 1 小的后缀的公共前缀,以及和字典序第 i+1 i + 1 小的后缀的公共前缀,故其不合法前缀数为 max(height[i],height[i+1]) m a x ( h e i g h t [ i ] , h e i g h t [ i + 1 ] ) ,对每个后缀累加其不合法前缀数即为重复出现的子串数
Code
#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set>
#include<ctime>
using namespace std;
typedef long long ll;
typedef pair<int,int>P;
const int INF=0x3f3f3f3f,maxn=100005;
int t1[maxn],t2[maxn],sa[maxn],c[maxn],Rank[maxn],height[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int n,int m)
{
n++;
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[i]=str[i]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n)break;
m=p;
}
int k=0;
n--;
for(i=0;i<=n;i++)Rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[Rank[i]-1];
while(str[i+k]==str[j+k])k++;
height[Rank[i]]=k;
}
}
int RMQ[maxn],mm[maxn],best[22][maxn];
void Init_rmq(int n)
{
for(int i=1;i<=n;i++)RMQ[i]=height[i];
mm[0]=-1;
for(int i=1;i<=n;i++)
mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];
for(int i=1;i<=n;i++)best[0][i]=i;
for(int i=1;i<=mm[n];i++)
for(int j=1;j+(1<<i)-1<=n;j++)
{
int a=best[i-1][j];
int b=best[i-1][j+(1<<(i-1))];
if(RMQ[a]<RMQ[b])best[i][j]=a;
else best[i][j]=b;
}
}
int Ask_rmq(int a,int b)
{
int t;
t=mm[b-a+1];
b-=(1<<t)-1;
a=best[t][a];b=best[t][b];
return RMQ[a]<RMQ[b]?a:b;
}
int T,k,a[maxn];
char s[maxn];
int main()
{
scanf("%d",&T);
while(T--)
{
scanf("%d %s",&k,s);
int n=strlen(s);
for(int i=0;i<n;i++)a[i]=s[i];
a[n]=0;
da(a,n,128);
height[n+1]=0;
Init_rmq(n);
ll ans=0;
if(k!=1)
{
for(int i=1;i<=n-k+1;i++)
{
int Min=height[Ask_rmq(i+1,i+k-1)];
ans+=max(0,Min-max(height[i],height[i+k]));
}
}
else
{
ans=(ll)n*(n+1)/2;
for(int i=1;i<=n;i++)ans-=max(height[i],height[i+1]);
}
printf("%I64d\n",ans);
}
return 0;
}