Description
求两个串的最长公共子串长度
Input
两个长度不超过100000的字符串
Output
输出这两个串的最长公共子串长度
Sample Input
yeshowmuchiloveyoumydearmotherreallyicannotbelieveit
yeaphowmuchiloveyoumydearmother
Sample Output
27
Solution
后缀数组,将两个串连在一起后求height[i]数组(连一起时中间要加一个隔离字符避免匹配越界),对于每个i,如果sa[i-1] < len且sa[i] > len(len为第一个串的串长),说明这两个相邻的后缀分别属于两个串,那么就用这个height[i]去更新答案,之所以可以这样做是因为做完后缀数组后所有后缀是按字典序排的,那么任意两个后缀的最长公共前缀长度不会超过字典序在这两个后缀之间的两个相邻后缀的height值
Code
#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
#define maxn 222222
int t1[maxn],t2[maxn],c[maxn],r[maxn],sa[maxn],rank[maxn],height[maxn];
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int str[],int sa[],int rank[],int height[],int n,int m)
{
n++;
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[i]=str[i]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n)break;
m=p;
}
int k=0;
n--;
for(i=0;i<=n;i++)rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[rank[i]-1];
while(str[i+k]==str[j+k])k++;
height[rank[i]]=k;
}
}
char a[maxn],b[maxn];
int main()
{
while(~scanf("%s%s",a,b))
{
int la=strlen(a),lb=strlen(b);
for(int i=0;i<la;i++)r[i]=a[i];
r[la]='#';
for(int i=0;i<lb;i++)r[i+la+1]=b[i];
r[la+lb+1]=0;
int n=la+lb+1;
da(r,sa,rank,height,n,128);
int ans=0;
for(int i=2;i<=n;i++)
if(sa[i-1]<la&&sa[i]>la||sa[i-1]>la&&sa[i]<la)
ans=max(ans,height[i]);
printf("%d\n",ans);
}
return 0;
}