题目描述
给出几个由小写字母构成的单词,求它们最长的公共子串的长度。
输入格式
文件的第一行是整数 n, 1 ≤ n ≤ 5 1\le n \le 5 1≤n≤5,表示单词的数量。接下来nn行每行一个单词,只由小写字母组成,单词的长度至少为1,最大为2000。
输出格式
仅一行,一个整数,最长公共子串的长度。
题解:
SA+二分:把所有串接在一起,中间用其他符号连接,然后二分答案,判断一段中的LCP是否来自所有串即可
SAM:用第一个串建立SAM,用其他串在上面匹配,在每个结点上匹配,过程中记录每个字符串在SAM上结点上的长度,对于每个状态取min,然后从最小值中选取最大值即为答案
AC代码(SA+二分):
#pragma GCC optimize(2)
#include<bits/stdc++.h>
#include<ext/rope>
using namespace std;
using namespace __gnu_cxx;
#define LL long long
const int MAXN = 10000+50;
const int MOD = 1e9+7;
const int INF = 0x3f3f3f3f;
char s[MAXN],t[MAXN];
int n,ls,bel[MAXN];
struct SA{
int sa[MAXN],rk[MAXN],h[MAXN],y[MAXN],c[MAXN],vis[10];
inline void get(int n,int m=150){
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[rk[i]=s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[rk[i]]]=i;
for(int k=1;k<=n;k<<=1){
int num=0;
for(int i=n-k;i<n;i++) y[num++]=i;
for(int i=0;i<n;i++) if(sa[i]>=k) y[num++]=sa[i]-k;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[rk[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[rk[y[i]]]]=y[i];
swap(rk,y);
rk[sa[0]]=0,num=1;
for(int i=1;i<n;i++)
rk[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k] ? num-1:num++);
if(num>=n) break;
m=num;
}
for(int i=1;i<n;i++) rk[sa[i]]=i;
for(int i=0,k=0;i<n;i++){
if(k) k--; else k=0;
int j=sa[rk[i]-1];
while(s[j+k]==s[i+k]) k++;
h[rk[i]]=k;
}
}
inline bool check(int mid){
int cnt=0;
for(int i=0;i<ls;i++){
if(h[i]>=mid){
if(bel[sa[i-1]] && !vis[bel[sa[i-1]]]) vis[bel[sa[i-1]]]=1,cnt++;
if(bel[sa[i]] && !vis[bel[sa[i]]]) vis[bel[sa[i]]]=1,cnt++;
if(cnt==n) return true;
}else{
cnt=0; memset(vis,0,sizeof(vis));
}
}
return false;
}
}sa;
signed main(){
#ifndef ONLINE_JUDGE
freopen("C:\\Users\\Administrator\\Desktop\\in.txt","r",stdin);
#endif // ONLINE_JUDGE
scanf("%d",&n);
for(int i=1;i<=n;i++){
scanf("%s",t);
int len=strlen(t);
for(int k=0;k<len;k++) s[ls]=t[k],bel[ls++]=i;
s[ls++]='#'+i;
}
s[ls]='#'+n+1;
if(n==1){ cout<<ls-1<<'\n'; return 0; }
sa.get(ls);
int l=0,r=10000,ans=0;
while(l<=r){
int mid=(l+r)>>1;
if(sa.check(mid)) l=mid+1,ans=mid;
else r=mid-1;
}
printf("%d\n",ans);
return 0;
}
AC代码(SAM):
#pragma GCC optimize(2)
#include<bits/stdc++.h>
#include<ext/rope>
using namespace std;
using namespace __gnu_cxx;
#define LL long long
#define pii pair<int,int>
#define mp(a,b) make_pair(a,b)
const int MAXN = 10000+10;
const int MOD = 1e9+7;
const int INF = 0x3f3f3f3f;
char s[MAXN],ss[MAXN];
struct Suffix{
int nxt[MAXN][26],fa[MAXN],len[MAXN];
int c[MAXN],a[MAXN],l[MAXN],res[MAXN];
int last=1,tot=1;
inline void Insert(int x){
int p=last,np=++tot;
last=np,len[np]=len[p]+1;
for(;p && !nxt[p][x];p=fa[p]) nxt[p][x]=np;
if(!p) fa[np]=1;
else{
int q=nxt[p][x];
if(len[p]+1==len[q]) fa[np]=q;
else{
int nq=++tot;
len[nq]=len[p]+1;
memcpy(nxt[nq],nxt[q],sizeof(nxt[q]));
fa[nq]=fa[q]; fa[q]=fa[np] = nq;
for(;nxt[p][x]==q;p=fa[p]) nxt[p][x] = nq;
}
}
}
inline void Sort(int n){
for(int i=1;i<=tot;i++) c[len[i]]++;
for(int i=1;i<=n;i++) c[i]+=c[i-1];
for(int i=1;i<=tot;i++) a[c[len[i]]--]=i;
memset(res,INF,sizeof(res));
}
inline void Solve(){
int p=1,ans=0,n=strlen(ss+1);
memset(l,0,sizeof(l));
for(int i=1;i<=n;i++){
int x=ss[i]-'a';
if(nxt[p][x]) p=nxt[p][x],ans++;
else {
while(p && !nxt[p][x]) p=fa[p];
if(!p) p=1,ans=0;
else ans=len[p]+1,p=nxt[p][x];
}
l[p]=max(l[p],ans);
}
for(int i=tot;i;i--){
int x=a[i];
res[x]=min(res[x],l[x]);
if(l[x] && fa[x]) l[fa[x]]=len[fa[x]];//如果它能够匹配到,那么它的fa也应该能匹配到
}
}
inline void Work(){
int ans = 0;
for(int i=1;i<=tot;i++) ans = max(ans,res[i]);
printf("%d\n",ans);
}
}SAM;
int main(){
#ifndef ONLINE_JUDGE
freopen("C:\\Users\\Administrator\\Desktop\\in.txt","r",stdin);
#endif // ONLINE_JUDGE
int n; scanf("%d",&n);
scanf("%s",s+1); int m=strlen(s+1);
for(int i=1;i<=m;i++) SAM.Insert(s[i]-'a');
SAM.Sort(m);
for(int i=2;i<=n;i++)
scanf("%s",ss+1),SAM.Solve();
SAM.Work();
return 0;
}