SPOJ 687. Repeats(后缀数组)
题意:给你一个长N的字符串,现在要你找出该字符串中具有最大循环节数目的连续子串.输出该子串的循环节数目即可.
分析:罗穗骞《后缀数组——处理字符串的有力工具》论文例题,不过论文中讲解的比较难懂.
首先还是引用论文的那段:
首先要明白上图其实就是用KMP算法自匹配循环节的标准图形.
难懂的地方在这里:
1. 什么时候可以往左匹配?
2. 往左匹配多长距离才够?
现在我们来分析上图的那个例子,假设前一步我们比较了后缀r[3]和r[6]的LCP,我们得出它们的LCP=0.现在我们要比较r[6]和r[9]的LCP,我们得出新的LCP=7.此时我们判断的长度L=3,所以循环节个数肯定至少>=3.(仔细想想是不是?画个图看看,这其实就是KMP自匹配循环节的图形)我们这个时候想往前推看看:
因为我们已经得到了LCP=7,而且我们只要r[4]==r[7]且r[5]=r[8]的话,LCP就可以达到9,我们得到的循环节就会到达4.所以我们只要往前推一段距离可以使得我们现在得到的LCP值+前推距离x>=(LCP/len)+1 即可.且我们不能前推使得jj(代码中的变量)<0,这没意义.且我们如果使得jj<=3其实也是没意义的.因为r[3]和r[6]的比较我们已经做了.所以上图的例子中,我们比较完r[6]和r[9]的LCP后,k=7时,往前推2个距离即可.(仔细想想这段内容)
AC代码:
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=50000+10;
struct SuffixArray
{
char s[maxn];
int sa[maxn],rank[maxn],height[maxn];
int t1[maxn],t2[maxn],c[maxn],n;
int mm[maxn];//mm[i]=k表示2^k是正好小于i的那个k. 而2^(k+1)>i了.
int dmin[maxn][20];
void build_sa(int m)
{
int i,*x=t1,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(i=n-k;i<n;i++) y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=k) y[p++]=sa[i]-k;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p=1,x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]? p-1:p++;
if(p>=n) break;
m=p;
}
}
void build_height()
{
int i,j,k=0;
for(i=0;i<n;i++)rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[rank[i]-1];
while(s[i+k]==s[j+k])k++;
height[rank[i]]=k;
}
}
void initMin()
{
mm[0]=-1;
for(int i=1;i<=n;i++)
{
dmin[i][0]=height[i];
mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];
}
for(int j=1;j<=mm[n];j++)
for(int i=1;i+(1<<j)-1<=n;i++)
dmin[i][j]=min(dmin[i][j-1] , dmin[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)//取得范围最小值
{
int k=mm[R-L+1];
return min(dmin[L][k] , dmin[R-(1<<k)+1][k]);
}
int LCP(int i,int j)//求后缀i和j的LCP最长公共前缀
{
int L=rank[i],R=rank[j];
if(L>R) swap(L,R);
L++;
return RMQ(L,R);
}
}sa;
int main()
{
int T;scanf("%d\n",&T);
while(T--)
{
int n;
scanf("%d\n",&n);
for(int i=0;i<n;i++)
{
char c;
scanf("%c\n",&c);
sa.s[i]=c;
}
sa.s[n]=0;
sa.n=n+1;
sa.build_sa(128);
sa.build_height();
sa.initMin();
int ans=1;
for(int len=1;len<n;len++)
{
for(int j=0;j+len<n;j+=len)
{
int k=sa.LCP(j,j+len);
int now=k/len+1;
int jj=j-(len-k%len);//往前推到jj位置
if(jj>=0)
if(sa.LCP(jj,jj+len)/len+1 > now) now++;
ans=max(ans,now);
}
}
printf("%d\n",ans);
}
return 0;
}