hdu 1403 后缀数组入门题

Longest Common Substring

Time Limit: 8000/4000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 4227    Accepted Submission(s): 1597


Problem Description
Given two strings, you have to tell the length of the Longest Common Substring of them.

For example:
str1 = banana
str2 = cianaic

So the Longest Common Substring is "ana", and the length is 3.
 

Input
The input contains several test cases. Each test case contains two strings, each string will have at most 100000 characters. All the characters are in lower-case.

Process to the end of file.
 

Output
For each test case, you have to tell the length of the Longest Common Substring of them.
 

Sample Input
  
  
banana cianaic
 

Sample Output
  
  
3
 

Author
Ignatius.L

注意一下题目中的是'substring',不是subsequence。

题目的数据范围是100000,所以用平常的o(n^2)的算法会TLE。

选择后缀数组来进行操作。

考虑测试用例:banana,cianaic

后缀数组的一个常规操作就是将两个字符串接起来进行操作。

我们可以在两个字符串之间接上'$',那么我们构造出的height数组的最大值就是所求的答案。

那为什么我们要用'$'分开来?

1.'$'的ASCII码值比字母小(虽然这句话很逗,但是确实有人用了例如'|'的分隔符)

2.通过ASCII码值,我们可以起到分离两个字符串的效果,两个串的lcp是不可能越过分隔符的。

一些推广:如果有多个字符串要求lcs,那么连起来就可以了,当然,要注意分隔符。最好是取不一样的分隔符。

代码:

#include<stdio.h>
#include<iostream>
#include<string.h>
#define N 200005
using namespace std;
int s[N],t1[N],t2[N],x[N],c[N],sa[N],rank[N],height[N];
char str[N];
void build_sa(int *s,int n,int m)
{
    int i,*x=t1,*y=t2,k;
    for(i=0;i<m;i++) c[i]=0;
    for(i=0;i<n;i++) c[x[i]=s[i]]++;
    for(i=1;i<m;i++) c[i]+=c[i-1];
    for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
    for(k=1;k<=n;k<<=1)
    {
        int p=0;
        for(i=n-k;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++)  if(sa[i]>=k) y[p++]=sa[i]-k;
        for(i=0;i<m;i++) c[i]=0;
        for(i=0;i<n;i++) c[x[y[i]]]++;
        for(i=1;i<m;i++) c[i]+=c[i-1];
        for(i=n-1;i>=0;i--)  sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1; x[sa[0]]=0;
        for(i=1;i<n;i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        if(p>=n) break;
        m=p;
    }
}
void getheight(int n)
{
    int i,j,k=0;
    for(i=0;i<n;i++)
        rank[sa[i]]=i;
    for(i=0;i<n;i++)
    {
        if(k) k--;
        int j=sa[rank[i]-1];
        while(s[i+k]==s[j+k]) k++;
        height[rank[i]]=k;
    }
}
int main()
{
    int len1,len,i,ans;
    while(scanf("%s",str)!=EOF)
    {
        len=strlen(str); len1=len;
        str[len]='$';
        scanf("%s",str+len+1);
        len=strlen(str);
        for(i=0;i<len;i++)
            s[i]=str[i];
        build_sa(s,len,130);
        getheight(len);
       ans=0;
        for(i=0;i<len;i++)
        {
            if(height[i]>ans&&((sa[i-1]<len1&&sa[i]>=len1)||(sa[i-1]>=len1&&sa[i]<len1)))
                ans=height[i];
        }
        printf("%d\n",ans);
    }
    return 0;
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值