思路
就是用后缀数组加二分,这里要把每一个子串连成一个串,每一个串用一个不可能出现的字符,例如#,*之类的分开,然后对连城的字符串做后缀数组,再二分一下最长公共串长度就可以了。
代码(转载)
#include<iostream>
#include<algorithm>
#include<stdio.h>
#include<string.h>
#include<vector>
using namespace std;
const int N=1000010;
int s[N];
int c[N],x[N],y[N],n,m,height[N],rk[N],sa[N];
void Suffix()
{
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[i]=s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(int i=n-k;i<n;i++) y[p++]=i;
for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(int i=1;i<n;i++)
x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
if(p>=n) break;
m=p;
}
}
void getheight()
{
for(int i=0;i<n;i++) rk[sa[i]]=i;
for(int i=0,k=0;i<n;i++)
{
if(rk[i])
{
if(k) --k;
//else k=0;
int j=sa[rk[i]-1];
while(s[i+k]==s[k+j]) k++;
height[rk[i]]=k;
}
}
}
char str[4010];
int vis[N],mp[N];int t;//mp记录每一个子串的位置
int mar[N];
vector<int>ans[1010];
int check(int x)
{
for(int i=1;i<n;i++)
{
if(height[i]<x) continue;
int cnt=0;
for(int j=0;j<=t;j++) vis[j]=0;
while(height[i]>=x&&i<n)
{
if(!vis[mp[sa[i-1]]])//这里用vis记一下那些串被用过了,一方面防止一子串多次记录,一方
//面防止在同一个串里匹配
{
vis[mp[sa[i-1]]]=1;
cnt++;
}
i++;
}
if(!vis[mp[sa[i-1]]])
{
vis[mp[sa[i-1]]]=1;
cnt++;
}
if(cnt>t/2)//最后我们还要看一下有没有符合要求
{
ans[x].push_back(sa[i-1]);
}
}
if(ans[x].size()!=0) return 1;
return 0;
}
int main()
{
int scc=0;
while(~scanf("%d",&t)&&t)
{
if(scc)cout<<endl;scc++;
for(int i=0;i<=1000;i++)
ans[i].clear();
n=0;
for(int i=0;i<t;i++)
{
scanf("%s",str);
int l1=strlen(str);
for(int j=0;j<l1;j++)
{
s[n++]=str[j]-'a'+1;
mp[n-1]=i;
}
s[n++]='#'+i;
}
s[n++]=0;
m=150;
Suffix();
getheight();
int l=1,r=1000,mid,len=0;
while(l<=r)
{
mid=(l+r)>>1;
if(check(mid))
{
len=mid;
l=mid+1;
}
else
r=mid-1;
}
if(len==0) printf("?\n");
else
{
for(int i=0;i<ans[len].size();i++)
{
for(int j=ans[len][i];j<ans[len][i]+len;j++)
printf("%c",s[j]+'a'-1);
printf("\n");
}
}
}
return 0;
}