题目描述
传送门
题意:给定一个字符串,求重复次数最多的连续重复子串。输出满足题意的子串,如果有多个,输出字典序最小的。
题解
先枚举长度 L ,然后求长度为 L 的子串最多能连续出现几次。首先连续出现 1 次是肯定可以的,所以这里只考虑至少 2 次的情况。假设在原字符串中连续出现 2 次,记这个子字符串为 S ,那么 S 肯定包括了字符 r[0], r[L], r[L*2], r[L*3], …… 中的某相邻的两个。所以只须看字符 r[L*i] 和 r[L*(i+1)] 往前和往后各能匹配到多远,记这个总长度为 K ,那么这里连续出现了 K/L+1 次。最后看最大值是多少。
求 height 区间最小值可以用st表实现
O(1)
查询。
但是这道题还有一点比较麻烦的是,要输出字典序最小的那个子串。也就是说,我们不光要确定最大值,还要确定子串的长度和位置,并且保证子串字典序最小。可以发现,每一次枚举向两边扩展即是确定的一个区间,这个区间内所有L*(K/L+1)长度的子串都符合要求。那么我们可以在起点满足题意的区间内同样用st表查询rank的最小值,也就是字典序最小的满足题意的串的起始位置。
时间复杂度
O(n1+n2+n3+...+nn)=O(nlogn)
代码
#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 100005
#define sz 17
char a[N];
int T,n,m,ans,ansp,ansl,u,v;
namespace L
{
char s[N];
int *x,*y,X[N],Y[N],c[N],sa[N],height[N],rank[N];
int st[N][sz+5],lg[N];
void clear()
{
for (int i=0;i<n;++i) s[i]=a[n-i-1];
memset(X,0,sizeof(X));memset(Y,0,sizeof(Y));memset(c,0,sizeof(c));
memset(sa,0,sizeof(sa));memset(height,0,sizeof(height));memset(rank,0,sizeof(rank));
memset(st,0,sizeof(st));memset(lg,0,sizeof(lg));
}
void build_sa()
{
m=200;
x=X,y=Y;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[i]=s[i]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;++i) y[p++]=i;
for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[y[i]]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1,x[sa[0]]=0;
for (int i=1;i<n;++i)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&((sa[i-1]+k<n?y[sa[i-1]+k]:-1)==(sa[i]+k<n?y[sa[i]+k]:-1))?p-1:p++;
if (p>n) break;
m=p;
}
}
void build_height()
{
for (int i=0;i<n;++i) rank[sa[i]]=i;
int k=0;height[0]=0;
for (int i=0;i<n;++i)
{
if (!rank[i]) continue;
if (k) --k;
int j=sa[rank[i]-1];
while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k;
height[rank[i]]=k;
}
}
void rmq()
{
for (int i=1,p=0;i<=n;++i)
{
while ((1<<p)<=i) ++p;
lg[i]=p-1;
}
for (int i=1;i<=n;++i) st[i][0]=height[i-1];
for (int j=1;j<sz;++j)
for (int i=1;i<=n;++i)
if (i+(1<<j)-1<=n)
st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
int query(int l,int r)
{
if (l>r) swap(l,r);++l;
if (l>r) return 0;
int k=lg[r-l+1];
return min(st[l][k],st[r-(1<<k)+1][k]);
}
}
namespace R
{
char s[N];
int *x,*y,X[N],Y[N],c[N],sa[N],height[N],rank[N];
int st[N][sz+5],lg[N];
void clear()
{
for (int i=0;i<n;++i) s[i]=a[i];
memset(X,0,sizeof(X));memset(Y,0,sizeof(Y));memset(c,0,sizeof(c));
memset(sa,0,sizeof(sa));memset(height,0,sizeof(height));memset(rank,0,sizeof(rank));
memset(st,0,sizeof(st));memset(lg,0,sizeof(lg));
}
void build_sa()
{
m=200;
x=X,y=Y;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[i]=s[i]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;++i) y[p++]=i;
for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;++i) c[i]=0;
for (int i=0;i<n;++i) ++c[x[y[i]]];
for (int i=1;i<m;++i) c[i]+=c[i-1];
for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1,x[sa[0]]=0;
for (int i=1;i<n;++i)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&((sa[i-1]+k<n?y[sa[i-1]+k]:-1)==(sa[i]+k<n?y[sa[i]+k]:-1))?p-1:p++;
if (p>n) break;
m=p;
}
}
void build_height()
{
for (int i=0;i<n;++i) rank[sa[i]]=i;
int k=0;height[0]=0;
for (int i=0;i<n;++i)
{
if (!rank[i]) continue;
if (k) --k;
int j=sa[rank[i]-1];
while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k;
height[rank[i]]=k;
}
}
void rmq()
{
for (int i=1,p=0;i<=n;++i)
{
while ((1<<p)<=i) ++p;
lg[i]=p-1;
}
for (int i=1;i<=n;++i) st[i][0]=height[i-1];
for (int j=1;j<sz;++j)
for (int i=1;i<=n;++i)
if (i+(1<<j)-1<=n)
st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
int query(int l,int r)
{
if (l>r) swap(l,r);++l;
if (l>r) return 0;
int k=lg[r-l+1];
return min(st[l][k],st[r-(1<<k)+1][k]);
}
}
namespace Rank
{
int lg[N],st[N][sz+5];
void clear()
{
memset(lg,0,sizeof(lg));memset(st,0,sizeof(st));
}
void rmq()
{
for (int i=1,p=0;i<=n;++i)
{
while ((1<<p)<=i) ++p;
lg[i]=p-1;
}
for (int i=1;i<=n;++i) st[i][0]=R::rank[i-1];
for (int j=1;j<sz;++j)
for (int i=1;i<=n;++i)
if (i+(1<<j)-1<=n)
st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
}
int query(int l,int r)
{
++l,++r;
if (l>r) swap(l,r);
int k=lg[r-l+1];
return min(st[l][k],st[r-(1<<k)+1][k]);
}
}
bool cmp(int p,int q)
{
if ((R::rank[p])>(R::rank[q]))
return true;
else return false;
}
int main()
{
while (~scanf("%s",a))
{
if (a[0]=='#') break;
n=strlen(a);
if (n==1)
{
printf("Case %d: %s\n",++T,a);
continue;
}
L::clear();L::build_sa();L::build_height();L::rmq();
R::clear();R::build_sa();R::build_height();R::rmq();
Rank::clear();Rank::rmq();
ans=1;ansl=1;
ansp=R::sa[0];
for (int len=1;len<=n;++len)
{
u=0,v=len;
while (v<n)
{
int l1=L::query(L::rank[n-u-1]+1,L::rank[n-v-1]+1);
int l2=R::query(R::rank[u]+1,R::rank[v]+1);
if (l1<len&&l2<len) {u+=len,v+=len;continue;}
int k;
if (!l1||!l2) k=l1+l2;
else k=l1+l2-1;
if (k/len+1>ans)
{
ans=k/len+1;
ansl=ans*len;
int Min=Rank::query(u-l1+1,v+l2-ansl);
ansp=R::sa[Min];
}
else if (k/len+1==ans)
{
int nowl=ans*len;
int Min=Rank::query(u-l1+1,v+l2-nowl);
if (Min<R::rank[ansp])
{
ansp=R::sa[Min];
ansl=nowl;
}
}
u+=len,v+=len;
}
}
printf("Case %d: ",++T);
for (int i=ansp;i<ansp+ansl;++i)
putchar(a[i]);
putchar('\n');
}
return 0;
}