Description
给出几个由小写字母构成的单词,求它们最长的公共子串的长度。
任务:
l 读入单词
l 计算最长公共子串的长度
l 输出结果
题解:
初学后缀自动机,讲得可能不是很好……首先建出第一个串的后缀自动机,然后其他串在上面匹配,用 tmp[i] t m p [ i ] 记录这一次 i i 号节点的最长匹配长度,用记录 i i 号节点的匹配长度,因为是公共子串,用更新 f f 时要取min,然后最后取的max。要注意的就是还要对parent进行更新,因为是自下而上更新,所以要按照拓扑序倒序更新,拓扑序就是按照 mx[i] m x [ i ] 的大小排的,用个基数排序就好了。
代码:
#include<bits/stdc++.h>
using namespace std;
#define LL long long
#define pa pair<int,int>
const int Maxn=4010;
const int inf=2147483647;
int read()
{
int x=0,f=1;char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
while(ch>='0'&&ch<='9')x=(x<<3)+(x<<1)+(ch^48),ch=getchar();
return x*f;
}
int tot=1,last=1;
int son[Maxn][26],mx[Maxn],par[Maxn];
int sum[Maxn],tmp[Maxn],f[Maxn],to[Maxn];//to[i] 拓扑序为i对应的节点编号
void extend(int x)
{
int p=last,np=++tot;mx[np]=mx[p]+1;
while(p&&!son[p][x])son[p][x]=np,p=par[p];
if(!p)par[np]=1;
else
{
int q=son[p][x];
if(mx[p]+1==mx[q])par[np]=q;
else
{
int nq=++tot;mx[nq]=mx[p]+1;
for(int i=0;i<26;i++)son[nq][i]=son[q][i];
par[nq]=par[q];
par[q]=par[np]=nq;
while(son[p][x]==q)son[p][x]=nq,p=par[p];
}
}
last=np;
}
char s[6][Maxn];int n;
int main()
{
memset(f,127,sizeof(f));
n=read();
for(int i=1;i<=n;i++)scanf("%s",s[i]);
int l1=strlen(s[1]);
if(n==1)return printf("%d",l1),0;
for(int i=0;i<l1;i++)extend(s[1][i]-'a');
for(int i=1;i<=tot;i++)sum[mx[i]]++,f[i]=mx[i];
for(int i=1;i<=l1;i++)sum[i]+=sum[i-1];
for(int i=1;i<=tot;i++)to[sum[mx[i]]--]=i;
for(int j=2;j<=n;j++)
{
int t=0,now=1,len=strlen(s[j]);
memset(tmp,0,sizeof(tmp));
for(int i=0;i<len;i++)
{
int x=s[j][i]-'a';
if(son[now][x])now=son[now][x],t++;
else
{
while(now&&!son[now][x])now=par[now];
if(!now)now=1,t=0;
else t=mx[now]+1,now=son[now][x];
}
tmp[now]=max(tmp[now],t);
}
for(int i=tot;i;i--)
{
int a=to[i];
f[a]=min(f[a],tmp[a]);
if(par[a]&&f[a])tmp[par[a]]=mx[par[a]];
}
}
int ans=0;
for(int i=1;i<=tot;i++)ans=max(ans,f[i]);
printf("%d",ans);
}