突然发现前面写的后缀数组不太对,拍出来的sa数组不对。。。
改进:每次对字符串的长度n加一,然后求sa数组,sa[1],sa[2],sa[3],sa[4]...排名从1开始,height数组也是从1开始
思路:每个子串一定是某个后缀的前缀。如果所有的后缀按照suffix(sa[1]),suffix(sa[2]),suffix(sa[3]),suffix(sa[4])...加入,后来的后缀将产生n-sa[k]+1个新的前缀,担忧height[k]个跟前面的相同,所以要减去。(感谢罗穗骞大神的论文)
#include<iostream>
#include<cstdio>
#include<cstring>
#include<string>
#include<algorithm>
using namespace std;
const int maxn=1010;
int n;
int sa[maxn],height[maxn],Rank[maxn],t[maxn],t2[maxn],c[maxn];
char str[maxn];
void build_sa(int m)
{
int *x=t,*y=t2;
for(int i=0;i<m;i++)c[i]=0;
for(int i=0;i<n;i++)c[x[i]=str[i]]++;
for(int i=1;i<m;i++)c[i]+=c[i-1];
for(int i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(int i=n-k;i<n;i++)y[p++]=i;
for(int i=0;i<n;i++)if(sa[i]>=k)y[p++]=sa[i]-k;
for(int i=0;i<m;i++)c[i]=0;
for(int i=0;i<n;i++)c[x[y[i]]]++;
for(int i=1;i<m;i++)c[i]+=c[i-1];
for(int i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(int i=1;i<n;i++)
x[sa[i]]=(y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k])?p-1:p++;
if(p>n)break;
m=p;
}
}
void getheight()
{
int k=0;
for(int i=1;i<=n;i++)Rank[sa[i]]=i;
for(int i=0;i<n;i++)
{
if(k)k--;
int j=sa[Rank[i]-1];
while(str[i+k]==str[j+k])k++;
height[Rank[i]]=k;
}
}
void solve()
{
long long ans=0;
for(int i=1;i<=n;i++)
ans+=(long long)(n-sa[i]-height[i]);
printf("%lld\n",ans);
}
int main()
{
//freopen("in.txt","r",stdin);
int t;
scanf("%d",&t);
while(t--)
{
scanf("%s",str);
n=strlen(str);
n++;
build_sa(130);
n--;
getheight();
solve();
}
return 0;
}