题目:
http://acm.hdu.edu.cn/showproblem.php?pid=3518
分析:
KMP O(n^3)会超时;
用后缀数组解;
在字符串末尾添加一个‘#’,代表无限小字符(ASCII值小于‘a’);
得到height数组后;
枚举子串的长度lenth;
若有一段连续height值>=lenth,记录这段子串的出现位置的最左start1和最右start2;
若start1+lenth<=start2,表示不重叠,ans++;
代码:
#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std;
const int tmax=1005;
char s[tmax];
int len,t1[tmax],t2[tmax],sa[tmax],c[tmax],rrank[tmax],height[tmax];
int k;
void work()
{
int i,lenth,start1,start2,ans=0;
for(lenth=1;lenth<=(len+1)/2;lenth++)
{
start1=tmax;start2=-1;
for(i=0;i<len;i++)
{
if(height[i]<lenth)
{
if(start1+lenth<=start2) ans++;
start1=tmax;start2=-1;
}
else{
start1=min(start1,sa[i]);
start1=min(start1,sa[i-1]);
start2=max(start2,sa[i]);
start2=max(start2,sa[i-1]);
}
}
if(start1+lenth<=start2) ans++;
}
printf("%d\n",ans);
}
bool cmp(int *y,int i,int j)
{
if(y[i]!=y[j]) return y[i]<y[j];
int ri=i+k<=len?y[i+k]:-1;
int rj=j+k<=len?y[j+k]:-1;
return ri<rj;
}
void suffix()
{
int i,m=256,*x=t1,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<len;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=0;i<len;i++) sa[--c[x[i]]]=i;
for(k=1;k<=len;k<<=1)
{
int p=0;
for(i=len-k;i<len;i++) y[p++]=i;
for(i=0;i<len;i++)
if(sa[i]>=k) y[p++]=sa[i]-k;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<len;i++) c[x[y[i]]]++;
for(i=0;i<m;i++) c[i]+=c[i-1];
for(i=len-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
m=1;x[sa[0]]=0;
for(i=1;i<len;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i])==true?m++:m-1;
if(m>=len) break;
}
return;
}
void get_height()
{
int i,j,h=0;
for(i=0;i<len;i++) rrank[sa[i]]=i;
height[0]=0;
for(i=0;i<len;i++)
{
if(rrank[i]==0) continue;
j=sa[rrank[i]-1];
if(h>0) h--;
while(i+h<len&&j+h<len&&s[i+h]==s[j+h]) h++;
height[rrank[i]]=h;
}
return;
}
int main()
{
scanf("%s",s);
while(s[0]!='#')
{
memset(sa,0,sizeof(sa));
memset(rrank,0,sizeof(rrank));
memset(height,0,sizeof(height));
memset(t1,0,sizeof(t1));
memset(t2,0,sizeof(t2));
len=strlen(s);
s[len++]='#';
suffix();
get_height();
work();
//run();
scanf("%s",s);
}
return 0;
}