题目链接:http://www.spoj.com/problems/DISUBSTR/
题意:求一个字符串中有多少个不相同的字串
每一个子串都是字符串的一个后缀的前缀,这样问题就变为N个字符串有多少个不相同的前缀
按照sa[1],sa[2]….,sa[N]的顺序来考虑后缀
加入sa[i]时 一定有height[i]个前缀已经在前面被计数过
二期sa[i]的长度大于height[i]的前缀在前面没有被计数过,如果被计数过那么,存在一个后缀sa[k],sa[k]与sa[i]的lcp一定大于等于height[i]。但是有height数组的性质,LCP(sa[k],sa[i])等于height[k]~height[i]的最小值小于等于height[i],所以矛盾。以上可知,在加入后缀sa[i]时我们得到的新的前缀数量为sa[i] - height[i]
代码:
#include <cstdio>
#include <cstring>
#define sf scanf
#define pf printf
using namespace std;
const int maxn = 1000 + 5;
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1;i<=n;i++) rank[sa[i]]=i;
for(i=0;i<n;height[rank[i++]]=k)
for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
return;
}
int sa[maxn],rr[maxn];
char s[maxn];
int main(){
int T;
sf("%d",&T);
while( T-- ){
sf("%s",s);
int len = strlen(s);
for(int i = 0;i <= len;++i) rr[i] = s[i];
da(rr,sa,len + 1,256);
calheight(rr,sa,len);
int cnt = len * (len + 1) / 2;
for(int i = 1;i <= len;++i) cnt -= height[i];
pf("%d\n",cnt);
}
return 0;
}