Description
给出一个字符串,求这个字符串中重复次数不少于m次的最长字串长度以及这个子串在原串中最后一次出现的位置
Input
多组用例,每组用例第一行为一整数m,第二行为一长度不超过40000的字符串,以m=0结束输入
Output
输出两个整数,第一个整数为在这个字符串中重复次数不少于m次的最长子串的长度,第二个整数是这个子串在原串中最后一次出现的位置,如果不存在这样的子串则输出none
Sample Input
3
baaaababababbababbab
11
baaaababababbababbab
3
cccccc
0
Sample Output
5 12
none
4 2
Solution
对原串做完后缀数组后二分最大长度,对于每个二分值k,对height数组分组,如果某组中后缀数量大于等于m则找到这个组中sa[i]的最大值来更新答案值
Code
#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
#define maxn 44444
int t1[maxn],t2[maxn],c[maxn],sa[maxn],Rank[maxn],height[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int n,int m)
{
n++;
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[i]=str[i]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n)break;
m=p;
}
int k=0;
n--;
for(i=0;i<=n;i++)Rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[Rank[i]-1];
while(str[i+k]==str[j+k])k++;
height[Rank[i]]=k;
}
}
int n,m,pos,a[maxn];
char s[maxn];
int check(int mid)
{
int cnt=1,flag=0,temp=0;
for(int i=2;i<=n;i++)
{
if(height[i]>=mid)
{
cnt++;
temp=max(temp,(max(sa[i-1],sa[i])));
if(cnt>=m)
{
if(!flag)pos=temp;
else pos=max(pos,temp);
flag=1;
}
}
else cnt=1,temp=0;
}
return flag;
}
int main()
{
while(~scanf("%d",&m),m)
{
scanf("%s",s);
if(m==1)
{
printf("%d %d\n",strlen(s),0);
continue;
}
n=strlen(s);
for(int i=0;i<n;i++)a[i]=s[i];
a[n]=0;
da(a,n,222);
pos=0;
int l=1,r=n;
while(l<=r)
{
int mid=(l+r)>>1;
if(check(mid))l=mid+1;
else r=mid-1;
}
if(l==1)printf("none\n");
else printf("%d %d\n",l-1,pos);
}
return 0;
}