后缀数组入门题。
注意一下题目中的是'substring',不是subsequence。
题目的数据范围是100000,所以用平常的o(n^2)的算法会TLE。
选择后缀数组来进行操作。
考虑测试用例:banana,cianaic
后缀数组的一个常规操作就是将两个字符串接起来进行操作。
我们可以在两个字符串之间接上'$',那么我们构造出的height数组的最大值就是所求的答案。
那为什么我们要用'$'分开来?
1.'$'的ASCII码值比字母小(虽然这句话很逗,但是确实有人用了例如'|'的分隔符)
2.通过ASCII码值,我们可以起到分离两个字符串的效果,两个串的lcp是不可能越过分隔符的。
一些推广:如果有多个字符串要求lcs,那么连起来就可以了,当然,要注意分隔符。最好是取不一样的分隔符。
代码:
#include "cstdio"
#include "cstring"
#define maxn 200005
using namespace std;
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int sa[maxn];
char s[maxn];
int r[maxn];
int cmp(int *r,int a,int b,int l) {
return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[x[i]=r[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p)
{
for(p=0,i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0;i<n;i++) wv[i]=x[y[i]];
for(i=0;i<m;i++) ws[i]=0;
for(i=0;i<n;i++) ws[wv[i]]++;
for(i=1;i<m;i++) ws[i]+=ws[i-1];
for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
return;
}
int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1;i<n;i++) rank[sa[i]]=i;
for(i=0;i<n;height[rank[i++]]=k)
for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
return;
}
int main(){
while(scanf("%s",s)!=EOF){
int len1,len;
len1=len=(int)strlen(s);
scanf("%s",s+len);
//puts(s);
//printf("%d\n",len1);
len=(int)strlen(s);
//printf("%d\n",len);
for(int i=0;i<len;i++) r[i]=s[i];
da(r,sa,len,125);
calheight(r,sa,len);
int ans=0;
//for(int i=0;i<=len;i++) printf("%d ",height[i]);
//printf("\n");
for(int i=1;i<len;i++){
if(height[i]>ans&&((sa[i-1]<len1&&sa[i]>=len1)||(sa[i-1]>=len1&&sa[i]<len1))){
ans=height[i];
}
}
printf("%d\n",ans);
}
return 0;
}