【题目描述】
给定一个由小写英文字母构成的字符串T,求其不同子串个数。
【输入】
一个字符串,长度不超过100000。
没有传送门……
裸的后缀数组:所有子串就是各个后缀字符串的前缀,所以答案就是每一个后缀字符串的长度减去与前一个重复的字符个数的总和。
代码如下:
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e5+10;
const int M=3e5+30;
typedef long long ll;
ll ans;int sa[M],px[M],n;
int t1[M],t2[M],buf[N],rvsa[N];
char S[N];
void query()
{
ans+=n-rvsa[1]+1;
for(int i=2;i<=n;i++){
int p=n-rvsa[i-1]+1,a=rvsa[i-1];
int q=n-rvsa[i]+1,b=rvsa[i];
int u=0;
while(u<p && u<q && S[u+a]==S[u+b]) u++;
ans+=q-u;
}
}
void build()
{
int m=26;
for(int i=1;i<=n;i++) px[S[i]-'a'+1]=1;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=1;i<=n;i++) sa[i]=px[S[i]-'a'+1];
for(int k=0;(1<<k)<=n && m!=n;k++){
for(int i=0;i<=m;i++) px[i]=0;
for(int i=1;i<=n;i++) px[sa[i+(1<<k)]]++;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=n;i>=1;i--) t1[px[sa[i+(1<<k)]]--]=i;
for(int i=0;i<=m;i++) px[i]=0;
for(int i=1;i<=n;i++) px[sa[t1[i]]]++;
for(int i=1;i<=m;i++) px[i]+=px[i-1];
for(int i=n;i>=1;i--) t2[px[sa[t1[i]]]--]=t1[i];
m=0;
for(int i=1;i<=n;i++){
if(sa[t2[i]]!=sa[t2[i-1]] || sa[t2[i]+(1<<k)]!=sa[t2[i-1]+(1<<k)])
buf[t2[i]]=++m;else buf[t2[i]]=m;
}
for(int i=1;i<=n;i++) sa[i]=buf[i];
}
for(int i=1;i<=n;i++) rvsa[sa[i]]=i;
}
int main(){
scanf("%s",S+1);
n=strlen(S+1);
build();
query();
printf("%lld\n",ans);
return 0;
}