题意 : 求一个字符串中不同子串的个数
思路 : 因为每个子串必然某个后缀的前缀 , 那么我们只要计算这些后缀中不同前缀的个数。我们按照sa的顺序来计算这些前缀数 , 很显然当后缀 sa[i] 必然会有 n - sa[i] 个前缀 , 但是这些前缀可能会与之前的 sa[ j ] ( j < i ) 的前缀冲突 , 冲突的个数就是和前面所有sa[j] 的最大LCP了 , 很显然这个最大LCP就是height[i] , 那么当计算到sa[i]时,实际上有效的前缀是n-sa[i]-height[i] ,最后答案就是n-sa[i]-height[i] 的和
#include <stdio.h>
#include <string.h>
#include <algorithm>
using namespace std;
#define maxn 1005
#define maxm 1005
int wa[maxn],wb[maxn],wv[maxn],ws[maxm];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(char *r,int *sa,int n,int m){
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p){
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
int Rank[maxn],height[maxn];
void calheight(char *r,int *sa,int n){
int i , j , k = 0 ;
for( i=1 ; i<=n ; i++ ) Rank[sa[i]]=i;
for(i=0;i<n;i++) {
if(k)k--;
int j = sa[Rank[i]-1];
while(r[i+k]==r[j+k]) k++ ;
height[Rank[i]] = k ;
}
return;
}
int r[maxn] , sa[maxn] ;
char str[maxn] ;
int main(){
int cas ;
scanf( "%d" , &cas ) ;
while( cas -- ) {
scanf( "%s" , str ) ;
int Max = 0 ;
int len = strlen( str ) ;
for( int i = 0 ; i < len ; i ++ ) Max = max( Max , (int)str[i] ) ;
// 一开始RE , 后来发现字符串不一定是大写字母 , 以后字符范围还是直接求最大值 , 然后数组开大点靠谱 , 不要想当然了
/*
for( int i = 0 ; i < len ; i++ ) {
if( str[i] >= 'A' && str[i] <= 'Z' ) continue ;
else while( true ) ;
}*/
da( str , sa , len + 1 , Max + 1 ) ;
calheight( str , sa , len ) ;
int ans = 0 ;
for( int i = 1 ; i <= len ; i ++ )
ans += len - sa[i] - height[i] ;
printf( "%d\n" , ans ) ;
}
return 0 ;
}