Description
给定n个字符串,求在每个字符串中至少出现两次且不重叠的最长子串的长度
Input
第一行为一整数T(T<=10)表示用例组数,每组用例第一行为一整数n(n<=10)表示串的数量,之后n行每行为一个长度不超过10000字符串
Output
输出在每个字符串中至少出现两次且不重叠的最长子串的长度
Sample Input
1
4
abbabba
dabddkababa
bacaba
baba
Sample Output
2
Solution
求n个串最长公共子串和求一个串中最少出现两次且不重叠的最长字串问题的结合,做法也是这两个问题做法的结合,将n个串连在一起,相邻两串用隔离字符隔离开以避免匹配越界,用id数组记录每个子串所属串的编号,二分最长长度,对于每个二分长度k,对height数组分组,统计每一组中的每个id[sa[i]]的最大值Max[id[sa[i]]]和最小值Min[id[sa[i]]],如果n个id都满足Max[id[i]]-Min[id[i]]>=k则满足条件,如果每组都不满足条件则这个k值不满足条件
Code
#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
#define maxn 111111
#define INF 0x3f3f3f3f
int t1[maxn],t2[maxn],c[maxn],sa[maxn],rank[maxn],height[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int n,int m)
{
n++;
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[i]=str[i]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n)break;
m=p;
}
int k=0;
n--;
for(i=0;i<=n;i++)rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[rank[i]-1];
while(str[i+k]==str[j+k])k++;
height[rank[i]]=k;
}
}
int n,res,a[maxn],id[maxn];
int vis[11],Max[11],Min[11];
void init()
{
for(int i=0;i<=n;i++)
{
vis[i]=Max[i]=0;
Min[i]=INF;
}
}
char s[maxn];
int check(int k)
{
int cnt=0;
for(int i=1;i<=res;i++)
{
if(height[i]<k)
{
init();
Min[id[sa[i]]]=Max[id[sa[i]]]=sa[i];
continue;
}
Min[id[sa[i-1]]]=min(Min[id[sa[i-1]]],sa[i-1]);
Max[id[sa[i-1]]]=max(Max[id[sa[i-1]]],sa[i-1]);
Min[id[sa[i]]]=min(Min[id[sa[i]]],sa[i]);
Max[id[sa[i]]]=max(Max[id[sa[i]]],sa[i]);
int flag=1;
for(int j=0;j<n;j++)
if(Max[j]-Min[j]<k)
{
flag=0;
break;
}
if(flag)return 1;
}
return 0;
}
int main()
{
int T;
scanf("%d",&T);
while(T--)
{
scanf("%d",&n);
res=0;
for(int i=0;i<n;i++)
{
scanf("%s",s);
int len=strlen(s);
for(int j=0;j<len;j++)
a[res]=s[j],id[res++]=i;
a[res]='#'+i;
id[res++]='#'+i;
}
a[res]=0;
da(a,res,200);
int l=1,r=res,flag=0;
while(l<=r)
{
int mid=(l+r)>>1;
if(check(mid))l=mid+1;
else r=mid-1;
}
printf("%d\n",l-1);
}
return 0;
}