题意:给出一个字符串,求出现2次及以上且不重叠的子串的个数
思路:后缀数组,枚举长度,注意枚举长度时的写法,当height数组每一段处理完后,必须跳过这一段所有的串。
#include <cstdio>
#include <cstring>
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))
const int N = int(1e4)+10;
const int INF=0x3fffffff;
int cmp(int *r,int a,int b,int l){
return (r[a]==r[b]) && (r[a+l]==r[b+l]);
}
int wa[N],wb[N],ws[N],wv[N];
int rank[N],height[N];
void DA(int *r,int *sa,int n,int m){
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
//printf("p = %d\n", p );
}
}
void calheight(int *r,int *sa,int n){
// memset(height,0,sizeof(height));
// memset(rank,0,sizeof(rank));
int i,j,k=0;
for(i=1;i<=n;i++) rank[sa[i]]=i;
for(i=0;i<n; height[rank[i++]] = k )
for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++);
}
int data[N],sa[N],temp[N],n,k,start;
char str[N];
int Cal (int x)
{
int maxn,minn,ans=0;
for (int i=1;i<=n;i++)
{
int L=i;
while (L<=n && height[L]<x) L++;
if (L>n) break;
int R=L;
while (R<=n && height[R]>=x) R++;
minn=INF,maxn=-INF;
for (int j=L-1;j<=R-1;j++)
{
minn=min(minn,sa[j]);
maxn=max(maxn,sa[j]);
}
if (maxn-minn>=x)
ans++;
i=R;
}
return ans;
}
void Deal ()
{
DA(data,sa,n+1,200);
calheight(data,sa,n);
int i,ans=0,temp;
for (i=1;i<=n/2;i++)
{
temp=Cal(i);
if (temp==0) //不可能有更长的了
break;
ans+=temp;
}
printf("%d\n",ans);
}
int main ()
{
while (~scanf("%s",str),str[0]!='#')
{
n=strlen(str);
for (int i=0;i<n;i++)
data[i]=(int)str[i];
data[n] = 0;
Deal();
}
return 0;
}