本题是求解最长公共子串,解法有两种,第一种是二分+ 哈希,第二种是后缀数组。
下面介绍后缀数组的解法。
将两个字符串用分隔符28连接起来,末尾补0,那么只需要求出这个字符串的后缀数组和height数组,找到起点分别在两个字符串的最大的height值即答案。
AC代码:
#include <cstdio>
#include <cstring>
using namespace std;
const int N = 200010;
char s[N],str[N];
int sa[N],rank[N],height[N],wa[N],wb[N],wv[N],ws[N],a[N];
int cmp(int *r,int a,int b,int l) {
return r[a] == r[b] && r[a+l] == r[b+l];
}
void fun(int *r, int n, int m){
int i,j,p,*x = wa, *y = wb, *t;
for(i = 0; i < m; i ++) ws[i] = 0;
for(i = 0; i < n; i ++) ws[x[i] = r[i]] ++;
for(i = 1; i < m; i ++) ws[i] += ws[i-1];
for(i = n-1; i >= 0; i --) sa[--ws[x[i]]] = i;
for(j = 1, p = 1; p < n; j*=2, m = p){
for(p = 0, i = n-j; i < n; i ++) y[p++] = i;
for(i = 0; i < n; i ++)
if(sa[i] >= j)
y[p++] = sa[i]-j;
for(i = 0; i < n; i ++) wv[i] = x[y[i]];
for(i = 0; i < m; i ++) ws[i] = 0;
for(i = 0; i < n; i ++) ws[wv[i]] ++;
for(i = 1; i < m; i ++) ws[i] += ws[i-1];
for(i = n-1; i >= 0; i--) sa[--ws[wv[i]]] = y[i];
for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++)
x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;
}
}
void calheight(int *r, int n){
int i, j, k=0;
for(int i=1; i<=n; i++)
rank[sa[i]] = i;
for(int i=0; i<n; i++){
if(k) k--;
int j = sa[rank[i]-1];
while(r[i+k] == r[j+k]) k++;
height[rank[i]] = k;
}
}
int main(){
scanf("%s",s);
scanf("%s",str);
int n = 0;
int len = strlen(s);
for(int i=0; i<len; i++)
a[n++] = s[i] - 'a' + 1;
a[n++] = 28;//连接
len = strlen(str);
for(int i=0; i<len; i++)
a[n++] = str[i] - 'a' + 1;
a[n] = 0;//补0
fun(a, n+1, 34);
calheight(a, n);
len = strlen(s);
int ans = -1;
for(int i=2; i<=n; i++){
if(height[i] > ans){
if(sa[i-1] >= 0 && sa[i-1] < len && sa[i] > len)
ans = height[i];
if(sa[i] >= 0 && sa[i] < len && sa[i-1] > len)
ans = height[i];
}
}
printf("%d\n",ans);
return 0;
}