后缀数组是字符串处理神器,可以解决多类字符串问题,这篇博客写的不错,转载一下:【后缀数组】
简要来说,sa[i]是后缀排名第i位的起始位置,rank[i]是以第i位为起始位置的后缀的排名,正好和sa[i]相逆,也就是sa[rank[i]]=i,而height[i]存的是后缀sa[i]与sa[i-1]的最长公共前缀的长度。
题意:
给两个字符串,求最长公共子串。
思路:
这个是很裸的后缀数组题目,考虑到每个子串必定是某个后缀的前缀,而最长的重复部分一定是排名连续的两位,所以只需要合并两个字符串取height里最大的数就可以了。
另外因为可能会出现匹配错误,字符串在合并的中间最好加个符号分割,而且保证sa[i]和sa[i-1]在不同的两个字符串里。
ac代码,依然是kuangbin大爷的模版~:
#include <cstdlib>
#include <cstring>
#include <cstdio>
#include <algorithm>
using namespace std;
const int MAXN = 200010;
int sa[MAXN];
int t1[MAXN],t2[MAXN],c[MAXN];
int rank[MAXN],height[MAXN];
void build_sa(int s[],int n,int m)
{
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[i]=s[i]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
if(p>=n)break;
m=p;
}
}
void getHeight(int s[],int n)
{
int i,j,k=0;
for(i=0;i<=n;i++)rank[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[rank[i]-1];
while(s[i+k]==s[j+k])k++;
height[rank[i]]=k;
}
}
int seq[MAXN];
void suffix_array(char str[]){
int len = strlen(str);
for(int i = 0; i <= len; i++) seq[i] = str[i];
seq[len] = 0;
build_sa(seq, len + 1, 128);
getHeight(seq, len);
}
char str[MAXN];
int main() {
while(~scanf("%s", str)) {
int len1 = strlen(str);
str[len1] = '|';
scanf("%s", &str[len1 + 1]);
suffix_array(str);
int len = strlen(str);
int ans = 0;
for (int i = 2; i <= len; ++i) {
if(sa[i - 1] < len1 && sa[i] > len1) ans = height[i] > ans ? height[i] : ans;
if(sa[i - 1] > len1 && sa[i] < len1) ans = height[i] > ans ? height[i] : ans;
}
printf("%d\n", ans);
}
return 0;
}