/*
*suffix array
*倍增算法 O(n*logn)
*待排序数组长度为n,放在0~n-1中,在最后面补一个0
*da(str ,n+1,sa,rank,height, , );//注意是n+1;
*例如:
*n = 8;
*num[] = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0
*rank[] = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };rank[0~n-1]为有效值,rank[n]必定为0无效值
*sa[] = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值
*height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值
*
*/
#include <stdio.h>
#include <string.h>
#include<algorithm>
using namespace std;
const int MAXN=200000+10;
int t1[MAXN],t2[MAXN],c[MAXN];//求SA数组需要的中间变量,不需要赋值
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
//函数结束以后结果放在sa数组中
bool cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
int da(int str[],int sa[],int rank1[],int height[],int n,int m,int len1)
{
n++;
int i,j,p,*x=t1,*y=t2,ans=0;
//第一轮基数排序,如果s的最大值很大,可改为快速排序
for(i=0;i<m;i++) c[i]=0;
for(i=0;i<n;i++) c[x[i]=str[i]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
//直接利用sa数组排序第二关键字
for(i=n-j;i<n;i++) y[p++]=i;
for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
//这样数组y保存的就是按照第二关键字排序的结果
//基数排序第一关键字
for(i=0;i<m;i++) c[i]=0;//后面的j个数第二关键字为空的最小
for(i=0;i<n;i++) c[x[y[i]]]++;
for(i=1;i<m;i++) c[i]+=c[i-1];
for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
//根据sa和x数组计算新的x数组
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p>=n) break;
m=p;//下次基数排序的最大值
}
int k=0;
n--;
for(i=0;i<=n;i++)
rank1[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k) k--;
j=sa[rank1[i]-1];
while(str[i+k]==str[j+k]) k++;
height[rank1[i]]=k;
if(height[rank1[i]]>ans)
{
//printf("%d %d\n",sa[i],sa[i-1]);
if(sa[rank1[i]]>len1&&sa[rank1[i]-1]<len1)
ans=height[rank1[i]];
else if(sa[rank1[i]]<len1&&sa[rank1[i]-1]>len1)
ans=height[rank1[i]];
}
}
return ans;
}
char s1[MAXN],s2[MAXN];
int ch[MAXN];
int sa[MAXN];
int rank1[MAXN];
int height[MAXN];
int main()
{
int i,len1,len2;
while(~scanf("%s",s1))
{
scanf("%s",s2);
len1=strlen(s1);
len2=strlen(s2);
for(i=0; i<len1; i++)
ch[i]=s1[i];
ch[len1]=0;
for(i=0; i<len2; i++)
ch[len1+i]=s2[i];
ch[len1+len2]=0;
int ans=da(ch,sa,rank1,height,len1+len2+1,128,len1);
printf("%d\n",ans);
}
return 0;
}
hdu 1403 Longest Common Substring 后缀数组da算法
最新推荐文章于 2019-07-27 11:12:09 发布