POJ 3415 Common Substrings(后缀数组:后缀公共前缀个数)

273 篇文章 0 订阅
112 篇文章 0 订阅

POJ 3415 Common Substrings(后缀数组:后缀公共前缀个数)

http://poj.org/problem?id=3415

题意:

A substring of astring T is defined as:

T(i,k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|.

Given two stringsA, B and one integer K, we define S, a set of triples (i, j, k):

S = {(i, j, k) | k≥K, A(i, k)=B(j, k)}.

要我们求集合S中元素的个数.

分析: 罗穗骞《后缀数组——处理字符串的有力工具》论文例题.

其实就是求A的任一后缀和B的任一后缀能贡献的LCP>=K的个数和.

依然老做法,将A与B中间填个字符’$’,然后连接他们形成新字符串.然后求height.

       将height分组,然后对于每组内的height最小值必须>=k才行,那么这组内的任意一个A与B的后缀可以贡献的子串是LCP(ia,ib)-k+1个.(想想是不是).不过如果穷举每组的话可能会超时,所以这里用到了单调栈来处理,使得在O(n)时间内处理完.

AC代码:

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=200000+100;
struct SuffixArray
{
    char s[maxn];
    int sa[maxn],rank[maxn],height[maxn];
    int t1[maxn],t2[maxn],c[maxn],n;
    void build_sa(int m)
    {
        int i,*x=t1,*y=t2;
        for(i=0;i<m;i++) c[i]=0;
        for(i=0;i<n;i++) c[x[i]=s[i]]++;
        for(i=1;i<m;i++) c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
        for(int k=1;k<=n;k<<=1)
        {
            int p=0;
            for(i=n-k;i<n;i++) y[p++]=i;
            for(i=0;i<n;i++)if(sa[i]>=k) y[p++]=sa[i]-k;
            for(i=0;i<m;i++) c[i]=0;
            for(i=0;i<n;i++) c[x[y[i]]]++;
            for(i=1;i<m;i++) c[i]+=c[i-1];
            for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
            swap(x,y);
            p=1,x[sa[0]]=0;
            for(i=1;i<n;i++)
                x[sa[i]]= y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
            if(p>=n) break;
            m=p;
        }
    }
    void build_height()
    {
        int i,j,k=0;
        for(i=0;i<n;i++) rank[sa[i]]=i;
        for(i=0;i<n;i++)
        {
            if(k)k--;
            j=sa[rank[i]-1];
            while(s[i+k]==s[j+k]) k++;
            height[rank[i]]=k;
        }
    }
}sa;
int f[maxn];
int a[maxn],b[maxn],c;
long long ss,ans;

int main()
{
    int i,k,l,n,t;
    while(scanf("%d",&k)==1&&k)
    {
        scanf("%s",sa.s);
        l=strlen(sa.s);
        sa.s[l]=1;
        scanf("%s",sa.s+l+1);
        n=strlen(sa.s);
        sa.s[n]=0;
        sa.n=n+1;
        sa.build_sa(128);
        sa.build_height();

        for(i=2;i<=n;i++)
        {
            f[i]=sa.sa[i]<l;//f[i]=true 表示字典序第i个后缀是输入A串的
            sa.height[i]-=k-1;
            if(sa.height[i]<0) sa.height[i]=0;
        }
        sa.height[n+1]=0;
        a[0]=-1;ans=0;
        for(t=0;t<=1;t++)
        for(c=0,ss=0,i=2;i<=n;i++)//a这个栈从c=0到c=c是依height值增加的
        {
            if(f[i]!=t) ans+=ss;//t=0时遇到A串后缀,或t=1时遇到B串后缀,都要加上之前的结果
            c++;//c是栈的指针
            a[c]=sa.height[i+1];//a是用来保存当前扫描到的height值的栈,且a[c]是当前最小值
            b[c]=f[i]==t;//字典序第i个后缀属于A串且t==1或i后缀输入B且t==0,那么b[c]=1,否则b[c]=0
            ss+=(long long)a[c]*b[c];
            while(a[c-1]>=a[c])//维护单调性
            {
            ss-=(long long)(a[c-1]-a[c])*b[c-1];//减去刚刚多加的那部分
            a[c-1]=a[c];
            b[c-1]+=b[c];//这个的意思是一个值可能是多个区间的最小值
            c--;
            }
        }
        printf("%I64d\n",ans);
    }
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值