#include<string.h>
#include<algorithm>
using namespace std;
const int maxn=200000;
int t1[maxn],t2[maxn],c[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int sa[],int rank1[],int height[],int n,int m)
{
n++;
int i,j,p,*x=t1,*y=t2;
//第一轮基数排序,如果s的最大值很大,可改为快速排序
for(i=0; i<m; i++) c[i]=0;
for(i=0; i<n; i++) c[x[i]=str[i]]++;
for(i=1; i<m; i++) c[i]+=c[i-1];
for(i=n-1; i>=0; i--) sa[--c[x[i]]]=i;
for(j=1; j<=n; j<<=1)
{
p=0;
//直接利用sa数组排序第二关键字
for(i=n-j; i<n; i++) y[p++]=i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
//这样数组y保存的就是按照第二关键字排序的结果
//基数排序第一关键字
for(i=0; i<m; i++) c[i]=0; //后面的j个数第二关键字为空的最小
for(i=0; i<n; i++) c[x[y[i]]]++;
for(i=1; i<m; i++) c[i]+=c[i-1];
for(i=n-1; i>=0; i--) sa[--c[x[y[i]]]]=y[i];
//根据sa和x数组计算新的x数组
swap(x,y);
p=1;
x[sa[0]]=0;
for(i=1; i<n; i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n) break;
m=p;//下次基数排序的最大值
}
int k=0;
n--;
for(i=0; i<=n; i++)
rank1[sa[i]]=i;
for(i=0; i<n; i++)
{
if(k) k--;
j=sa[rank1[i]-1];
while(str[i+k]==str[j+k]) k++;
height[rank1[i]]=k;
}
}
int rk[maxn],height[maxn],str[maxn],sa[maxn];
char ss[maxn];
int main()
{
int i,m,n;
scanf("%d",&m);
while(m--)
{
scanf("%s",ss);
n=strlen(ss);
for(i=0;i<n;i++)
str[i]=ss[i];
str[n]=0;
da(str,sa,rk,height,n+1,128);
int ans=0;
for(i=0;i<n;i++)
{
//printf("%d %d\n",sa[i],height[i]);
ans+=n-i-height[rk[i]];
}
printf("%d\n",ans);
}
return 0;
}
SPOJ SUBST1 New Distinct Substrings 后缀数组-子串个数
最新推荐文章于 2020-03-31 22:56:17 发布