题目链接:https://cn.vjudge.net/problem/POJ-2774
参考:https://www.cnblogs.com/deadpool66/p/5989726.html
题意:有两个字符串,求他们最长连续公共字串。
思路:height[i]代表sa[I-1]与sa[i]的最长公共前缀,所以height数组从1开始遍历。sa数组中已经按照字典序排好了,所以相邻的两个一定是公共前缀最长的,因为字典序相差最小(对height数组的理解)。统计答案时要保证子串是分别在两边的,需要判断sa数组的大小,只是这样还不够,还需要给两个字符串之间添加分隔符,因为如果没有分隔符,前面字符串的后缀与后面的比较时,可能会把后面字符串当作前面字符串的后缀,导致答案变大,这样是不对的。如果加入了分隔符,就保证了最后一位相等的位置一定不会在第二个字符串内,也就是分割了字符串。
//#include <bits/stdc++.h>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn=2e5+5;
char s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn],n;
void build_sa(int m)
{
int i,*x=t,*y=t2;
for( i=0; i<m; i++)
c[i]=0;
for( i=0; i<n; i++)
c[x[i]=s[i]]++;
for( i=1; i<m; i++)
c[i]+=c[i-1];
for(i=n-1; i>=0; i--)
sa[--c[x[i]]]=i;
for(int k=1; k<=n; k<<=1)
{
int p=0;
for(i=n-k; i<n; i++)
y[p++]=i;
for(i=0; i<n; i++)
if(sa[i]>=k)
y[p++]=sa[i]-k;
for( i=0; i<m; i++)
c[i]=0;
for(i=0; i<n; i++)
c[x[y[i]]]++;
for(i=0; i<m; i++)
c[i]+=c[i-1];
for(i=n-1; i>=0; i--)
sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;
x[sa[0]]=0;
for(i=1; i<n; i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if(p>=n)
break;
m=p;
}
}
int rk[maxn],height[maxn];
void getheight()
{
int i,j,k=0;
for( i=0; i<n; i++)
{
rk[sa[i]]=i;
}
for(i=0; i<n; i++)
{
if(k)
k--;
j=sa[rk[i]-1];
while(s[i+k]==s[j+k])
k++;
height[rk[i]]=k;
}
}
int main()
{
char ss[maxn];
while(~scanf("%s",s))
{
int len=strlen(s);
s[strlen(s)+1]='\0';
s[strlen(s)]='$';
scanf("%s",ss);
strcat(s,ss);
n=strlen(s);
// printf("%s %d %d",s,strlen(s),n);
build_sa(130);
getheight();
int ans=0;
for(int i=1; i<n; i++)
{
if(height[i]>ans)
{
if(sa[i-1]>=0&&sa[i-1]<len&&sa[i]>len)
{
ans=height[i];
}
else if(sa[i]>=0&&sa[i]<len&&sa[i-1]>len)
{
ans=height[i];
}
}
}
printf("%d\n",ans);
}
return 0;
}