后缀数组 模板题 HDU 3518
构造最长公共前缀——Height
前提:求得rank[]数组,rank[i]表示第i个后缀的字典序排名;求得SA[]数组,SA[i]表示排名为i的后缀所在的位置
Heigth[i] 表示Suffix( SA[i] )和Suffix( SA[i - 1] )的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀
H[i] : 等于Height[Rank[i]],也就是后缀Suffix( i )和它前一名的后缀的最长公共前缀
而两个排名不相邻的最长公共前缀定义为排名在它们之间的Height的最小值
//HDU 3518 (求子串中不重叠重复出现的子串个数)
#include <bits/stdc++.h>
using namespace std;
#define maxn 1005
int wa[maxn],wb[maxn],wv[maxn],wt[maxn];
typedef long long LL ;
int r[maxn];
char str[maxn];
int sa[maxn],Rank[maxn],height[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
//桶排序并计算SA数组:
void da(int *r,int *sa,int n,int m){
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) wt[i]=0;
for(i=0;i<n;i++) wt[x[i]=r[i]]++;
for(i=1;i<m;i++) wt[i]+=wt[i-1];
for(i=n-1;i>=0;i--) sa[--wt[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p){
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) wt[i]=0;
for(i=0;i<n;i++) wt[wv[i]]++;
for(i=1;i<m;i++) wt[i]+=wt[i-1];
for(i=n-1;i>=0;i--) sa[--wt[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
//计算Height数组:
void calheight(int *r,int *sa,int n){
int i,j,k=0;
for( i=1;i<=n;i++ ) Rank[sa[i]]=i;
for(i=0;i<n;i++) {
if(k)k--;
int j=sa[Rank[i]-1];
while(r[i+k]==r[j+k]) k++;
height[Rank[i]]=k;
}
return;
}
int main(){
while(scanf("%s",str)!=EOF){
if(strcmp(str,"#")==0)
break;
int ans=0 ;
int len=strlen(str);
for(int i=0;i<len;i++) r[i]=str[i];r[len]=0;
da( r,sa,len+1,200 );
calheight(r,sa,len);
//上面都是求得SA[],Rank[],Height[]数组
//rank[i]第i个后缀的排名;SA[i]排名为i的后缀位置;Height[i]排名为i的后缀与排名为(i-1)的后缀的LCP(最长公共前缀)
for(int L=1;L<=len/2;L++) {//因为题目限制不能重叠,所以枚举匹配长度
int Max=sa[1],Min=sa[1];//初始化最大值最小值
for(int i=2;i<=len;i++){
if(height[i]<L){//如果排名i与i-1的子串的匹配长度小于L,则连续性被切断
if(Max-Min>=L)
ans++;
Max=Min=sa[i];//重新定义最大值最小值
}
Max=max(Max,sa[i]);
Min=min(Min,sa[i]);
}
if(Max-Min>=L)
ans++;
}
printf("%d\n",ans);
}
return 0 ;
}