我的第一道后缀数组。后缀数组都好理解,就是计数排序那个部分没有理解太明白。
本道题是求两个串的最长公共子串。论文中有提到一个串的情况下,这时候我们把两个串拼接起来就变为论文中的一个串的情况,就是找出height数组中最大值。万一最大的两个串在都在前面或者都在后面...,所以我们加个判断,sa[i]和sa[i-1]不在一起。而且还要把两个串拼接部分加上一些非小写字母的字符分隔开,防止出错。
#include"cstdlib"
#include"cstdio"
#include"cstring"
#include"cmath"
#include"queue"
#include"algorithm"
#include"iostream"
using namespace std;
#define N 200012
int sa[N],ra[N],height[N];
int t1[N],t2[N],c[N];
char a[N],b[N];
int v[N];
void getsa(int s[],int n,int m)
{
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=s[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
if(p>=n)break;
m=p;
}
}
void getheight(int n)
{
int i,j,k=0;
for(i=1;i<=n;i++) ra[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k) k--;
j=sa[ra[i]-1];
while(v[i+k]==v[j+k]) k++;
height[ra[i]]=k;
}
}
int main()
{
while(scanf("%s %s",a,b)!=EOF)
{
memset(v,0,sizeof(v));
int j=0,ans=0,len;
for(int i=0;a[i];i++)
v[j++]=a[i]-'a'+3;
v[j++]=1;
for(int i=0;b[i];i++)
v[j++]=b[i]-'a'+3;
v[j]=0;
len=strlen(a);
getsa(v,j+1,30);
getheight(j);
for(int i=1;i<=j;i++)
{
if((sa[i]>len&&sa[i-1]<len)||(sa[i]<len&&sa[i-1]>len))
ans=max(ans,height[i]);
}
printf("%d\n",ans);
}
return 0;
}