http://poj.org/problem?id=2774
纪念下我后缀数组第二题,也是自己不看题解A的后缀数组第一题
题意就是给你两个很长的字符串之后求最长公共子串的长度。
套用的是那篇后缀数组论文里的模板,之后因为要求两个串的最长公共子串,要把两个串连在一起,中间用一个不会出现的字符链接。我是把两个串转换成 s[i]-‘a’+1的形式之后以0为连接符号。
之后套模板求出SA 和 height数组。之后因为height数组的性质,求出最长公共子串的长度。这里的最长长度不是height数组的最大值,因为很可能出现同一串里的公共子串比两个串的公共子串要长
比如:
aaaaaaaaaaaaaaaaaaaaimiss
imiss
这样就是一个例子,判断的时候要注意一下保证这两个sa[i] 和sa[i-1]是在两个不同的字符串里就行具体看代码
#include <stdio.h>
#include <algorithm>
#include <iostream>
#define maxs 1000040
#include <string.h>
using namespace std;
int s[maxs];
char input1[maxs],input2[maxs];
int sa[maxs],rank[maxs],height[maxs];
int wa[maxs],wb[maxs],wv[maxs],wd[maxs];
int cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void get_sa(int *r,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t=NULL;
for(i=0; i<m; i++) wd[i]=0;
for(i=0; i<n; i++) wd[x[i]=r[i]]++;
for(i=1; i<m; i++) wd[i] +=wd[i-1];
for(i=n-1; i>=0; i--) sa[--wd[x[i]]]=i;
for(j=1,p=1;p<n;j*=2,m=p){
for(p=0,i=n-j;i<n;i++) y[p++] = i;
for(i=0;i<n;i++) if(sa[i] >= j) y[p++] = sa[i] -j;
for(i=0;i<n;i++) wv[i] = x[y[i]];
for(i=0;i<m;i++) wd[i] = 0;
for(i=0;i<n;i++) wd[wv[i]]++;
for(i=1;i<m;i++) wd[i]+=wd[i-1];
for(i=n-1;i>=0;i--) sa[--wd[wv[i]]] = y[i];
for(swap(x,y),p=1,x[sa[0]]=0,i=1; i<n; i++){
x[sa[i]] = cmp(y,sa[i-1],sa[i],j) ? p-1:p++;
}
}
// printf("This is SA\n");
/* for(int i=0;i<=n;i++)
{
printf("SA[%d] is %d\n",i,sa[i]);
}*/
}
void build_height(int *r,int n)
{
int i,j,k=0;
for(i=1;i<=n;i++) rank[sa[i]] =i;
for(i=0;i<n;height[rank[i++]] =k) {
for(k ? k-- : 0,j=sa[rank[i]-1]; r[i+k]==r[j+k];k++);
}
// printf("This is Height\n\n");
/*for(int i=0;i<=n;i++)
{
printf("h[%d] is %d\n",i,height[i]);
}*/
}
int abs(int aa)
{
if(aa>0)
return aa;
else return -aa;
}
int main()
{
while(~scanf("%s",input1))
{
scanf("%s",input2);
memset(sa,0,sizeof(sa));
memset(height,0,sizeof(height));
memset(rank,0,sizeof(rank));
memset(s,0,sizeof(s));
int len1=strlen(input1);
int len2=strlen(input2);
int id,cnt=0;
for(int i=0;i<len2;i++)
{
id=input2[i]-'a'+1;
s[cnt++]=id;
}
s[cnt++]=0;//这里为连接字符
// printf("len1 is %d This time cnt is %d\n",len1,cnt);
for(int i=0;i<len1;i++)
{
id=input1[i]-'a'+1;
s[cnt++]=id;
}
s[cnt]=0;//模板上说的这里为0
get_sa(s,cnt+1,40);//套用格式
build_height(s,cnt);//同理
int ans=0;
for(int i=0;i<cnt;i++)
{
if(height[i]>ans)
{
if((sa[i]<len2&&sa[i-1]>len2)||(sa[i]>len2&&sa[i-1]<len2))//判断两个后缀是否在不同的字符串中。
{
ans=height[i];
// printf("i is %d height[i] is %d SA[i] is %d\n",i,height[i],sa[height[i]]);
}
}
}
printf("%d\n",ans);
}
return 0;
}
/*
yeshowmuchiloveyoumydearmotherreallyicannotbelieveit
yeaphowmuchiloveyoumydearmother
hhhhhhhhhhhhimissyoujujumen
imissyoujujumen
wowowowwowowowoshinibaba
shinibaba
*/