题意:求一个串中,所有本质不同子串的出现次数的平方和。
题解:
对于只出现一次的串的贡献, SA[i]与 SA[i−1]、SA[i] 与 SA[i+1]的LCP的max表示这个串的前max个是不止出现一次,所以该串的长度−max就是只出现一次的串的个数,for一遍,求出每个sa[i]对应的贡献加起来即可
对于出现多次的串的贡献。
对于i,l[i]表示左边第一个数使height[l[i]]<height[i],r[i]表示右边第一个数使height[r[i]]<height[i],。r[i]-l[i]-1的值等于长度为height[i]的串出现了多少次。
我们用单调栈来维护一个 height 升序的单调栈st,st[now]记录height值,pos[now]记录相应的位置.
做过一些后缀数组+单调栈的题,过程看代码应该很好理解。
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=2e5+10,inf=0x3f3f3f3f;
int sa[N];
int rk[N];
int tmp[N];
int lcp[N];
char s[N],t[N];
int n,k;
bool cmp(int i,int j){
if(rk[i] != rk[j]) return rk[i]<rk[j];
else
{
int ri=i+k<=n?rk[i+k]:-1;
int rj=j+k<=n?rk[j+k]:-1;
return ri<rj;
}
}
void build(char *s,int *sa)
{
n=strlen(s);
for(int i=0;i<=n;i++){
sa[i]=i;
rk[i]=i<n?s[i]:-1;
}
for(k=1;k<=n;k*=2){
sort(sa,sa+n+1,cmp);
tmp[sa[0]]=0;
for(int i=1;i<=n;i++){
tmp[sa[i]]=tmp[sa[i-1]]+(cmp(sa[i-1],sa[i])?1:0);
}
for(int i=0;i<=n;i++){
rk[i]=tmp[i];
}
}
}
void LCP(char *s,int *sa,int *lcp){
n=strlen(s);
for(int i=0;i<=n;i++) rk[sa[i]]=i;
int h=0;
lcp[0]=0;
for(int i=0;i<n;i++){
int j=sa[rk[i]-1];
for (h ? h-- : 0; j + h < n&&i + h < n&&s[j + h] == s[i + h]; h++);
lcp[rk[i]-1] = h;
}
}
int st[N],pos[N];
int main() {
int T;
scanf("%d",&T);
while(T--){
scanf("%s",s);
int n=strlen(s);
build(s,sa);
LCP(s,sa,lcp);
for(int i=0;i<n;i++){
//printf("@%d\n",rk[i]);
}
int now=0;
lcp[n]=0;
ll ans=0;
for(int i=1;i<=n;i++){
int newpos=i,len=lcp[i];
while(now>0&&st[now]>len){
ll v1=st[now]-max(st[now-1],len);
ll v2=i-pos[now]+1;
ans+=v1*v2*v2;
newpos=pos[now--];
}
st[++now]=len;
pos[now]=newpos;
}
for(int i=0;i<n;i++){
ans+=n-i-max(lcp[rk[i]-1],lcp[rk[i]]);
//printf("!%lld %d %d\n",ans,lcp[rk[i]],lcp[rk[i]+1]);
}
printf("%lld\n",ans);
}
return 0;
}