做法:
- 我们知道,字符串中任意一个子串都是某个后缀的前缀
- 我们也知道了Height数组的含义是排名为i的后缀与排名i-1的后缀的最长公共前缀,即就是最长公共子串。
- 现在题意让我们找两个串的最长公共子串,普通的KMP是无法解决这样的匹配的问题,因为KMP是完全匹配,而本题可出现子串的匹配。
- 通过上述,我们发现,我们可以有这样的思路,即将两个串合成一个,求Height数组,那Height数组最大值岂不是ans? 思路是对的,但是要注意特殊情况。
- 比如原题中给的这种abab和a的这个样例,我们如果求最大的Height,ans = 2,但正确的ans应该为1,因为第一个串abab中自己的Height数组值,影响了答案。
- 两个串合并为一个abab#a,我们只需要以#为界,保证Height数组所代表的一组后缀来源于不同串即可。
AC代码:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
#define IO ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x) push_back(x)
#define sz(x) (int)(x).size()
#define sc(x) scanf("%d",&x)
#define abs(x) ((x)<0 ? -(x) : x)
#define all(x) x.begin(),x.end()
#define mk(x,y) make_pair(x,y)
#define debug printf("!!!!!!\n")
#define fin freopen("in.txt","r",stdin)
#define fout freopen("out.txt","w",stdout)
using namespace std;
typedef long long ll;
typedef pair<int,int> PII;
const int mod = 1e9+7;
const double PI = 4*atan(1.0);
const int maxm = 1e6;
const int maxn =2e5+10;
const int INF = 0x3f3f3f3f;
const ll LINF = 1ll<<62;
const int m = 128; //
string s0,s1;
char s[maxn]; //待排序的字符串放在s数组中,从s[0~n-1],长度为n,且最大值小于m,最后一位是0(无效值)
int sa[maxn],t1[maxn],t2[maxn],c[maxn],n,pos; //sa[1~n]为有效值,sa[0]必定为n是无效值
int rk[maxn]; //rank[0~n-1]为有效值,rank[n]必定为0无效值
int height[maxn]; //height[1~n]
//lcp(x,y):字符串x与字符串y的最长公共前缀,在这里指x号后缀与与y号后缀的最长公共前缀
//height[i]:lcp(sa[i],sa[i-1]),即排名为i的后缀与排名为i-1的后缀的最长公共前缀
//H[i]:height[rak[i]],即i号后缀与它前一名的后缀的最长公共前缀
void build_sa(int m)
{
n++;
int *x = t1,*y = t2;
for(int i=0;i<m;i++) c[i] = 0;
for(int i=0;i<n;i++) c[x[i] = s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]] = i;
for(int j=1;j<=n;j<<=1)
{
int p = 0;
for(int i = n-j;i<n;i++) y[p++] = i;
for(int i=0;i<n;i++) if(sa[i]>=j) y[p++] = sa[i]-j;
for(int i=0;i<m;i++) c[i] = 0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p = 1;x[sa[0]] = 0;
for(int i=1;i<n;i++)
x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+j] == y[sa[i]+j])?p-1:p++;
if(p>=n) break;
m = p;
}
n--;
int k = 0;
for(int i=0;i<=n;i++) rk[sa[i]] = i;
for(int i=0;i<n;i++){
if(k) k--;
int j = sa[rk[i]-1];
while(s[i+k] == s[j+k]) k++;
height[rk[i]] = k;
}
}
void solve()
{
int ans = -1;
for(int i=1;i<=n;i++)
{
if((sa[i]<=pos && sa[i-1]>pos) || (sa[i]>pos && sa[i-1]<=pos)) //两种情况都有可能
ans = max(ans,height[i]);
}
cout<<ans<<endl;
}
int main()
{
// fin;
IO;
cin>>s0>>s1;
pos = s0.length();
// cout<<pos<<endl;
s0 +="#"+s1;
// cout<<s0<<endl;
n = s0.length();
strcpy(s,s0.c_str());
build_sa(m);
// for(int i=1;i<=n;i++) cout<<sa[i]<<" ";
// cout<<endl;
solve();
return 0;
}