题意:
给定串S,和两个整数A,B,
问S有多少个子串出现次数在[A,B]内。
数据范围:sum(|S|)<=2e6,所有字符由大写字母组成
解法:
标记endpos,然后拓扑计算出每种串出现的次数,然后就可以直接统计答案了。
ps:
题面上面只写了sum(|S|)<=2e6,但是没说单个串的长度最大最大,
开2e6的超内存了,开1e5直接越界超时,开2e5才过,
貌似是赛中数据范围没给出锅了?
code:
#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int maxm=2e5+5;
char s[maxm];
int n;
int L,R;
struct SAM{
int ch[maxm][26];
int fa[maxm],l[maxm];//l[]是等价类的最长字符串长度len
int last=1,tot=1;//tot是节点数量
//
int cnt[maxm];
int idx[maxm];
int sz[maxm];
//
void add(int c){//传入s[i]-'a'而不是s[i]
int p=last,np=++tot;last=np;l[np]=l[p]+1;
for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;
if(!p)fa[np]=1;
else{
int q=ch[p][c];
if(l[p]+1==l[q])fa[np]=q;
else{
int nq=++tot;l[nq]=l[p]+1;
memcpy(ch[nq],ch[q],sizeof ch[q]);
fa[nq]=fa[q];fa[q]=fa[np]=nq;
for(;ch[p][c]==q;p=fa[p])ch[p][c]=nq;
}
}
sz[np]=1;
}
void init(){
for(int i=1;i<=tot;i++){
memset(ch[i],0,sizeof ch[i]);
fa[i]=l[i]=0;
sz[i]=0;
cnt[i]=0;
}
last=tot=1;
}
ll solve(){
//基数排序
for(int i=1;i<=tot;i++)cnt[l[i]]++;
for(int i=1;i<=tot;i++)cnt[i]+=cnt[i-1];
for(int i=1;i<=tot;i++)idx[cnt[l[i]]--]=i;
//逆向拓扑
for(int i=tot;i>=1;i--){
int x=idx[i];
sz[fa[x]]+=sz[x];
}
//
ll ans=0;
for(int i=1;i<=tot;i++){
int x=idx[i];
if(sz[x]>=L&&sz[x]<=R){
ans+=l[x]-l[fa[x]];
}
}
return ans;
}
}S;
signed main(){
while(scanf("%s",s+1)!=EOF){
S.init();
scanf("%d%d",&L,&R);
n=strlen(s+1);
for(int i=1;i<=n;i++){
S.add(s[i]-'A');
}
ll ans=S.solve();
printf("%lld\n",ans);
}
return 0;
}