poj 3415 Common Substrings 后缀数组

     给两个字符串A,B,定义:S = {(ijk) | kKA(ik)=B(jk)}.求有多少个三元组S。翻译一下就是枚举A中每一个长度大于等于k的子串在B中匹配,问全部成功匹配的次数,当然直接这么求得话肯定会T...这题之前用后缀自动机写过,感觉思路比后缀数组好想点...网上看到一个SA+单调栈的但由于智太硬了没看懂...然后又看到了一个神奇的做法..原帖:http://blog.csdn.net/u010690055/article/details/9844463

大致是利用height数组的单调性来分组求解,每组中A串的数量*B串的数量就是本组的答案,累加起来就是总的匹配数。

    原文说的感觉太简略了,我简单讲一下把,按height的大小(也就是LCS子串的长度)来分组,在height递增的时候,用一个数组st来记录长度为height[i]的分组的左边界,当height开始递减时(即第一次遇到height[i]<height[i-1]的情况时),表示所有长度在height[i]+1至height[i-1]的分组都会在这里结束,也就是这些组的答案都要在这里处理出来,处理答案的话可以用两个数组记录一下串A串B当前出现的次数就好。

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <string>
#include <cstring>
using namespace std;
typedef long long ll;
const int maxn=220100;
int s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn];
int sa2[maxn];
char s1[maxn],s2[maxn];
int rank[maxn],height[maxn];
int l1,l2;
int len,len1;
int n,m;
ll ans;
inline int idx(char s)
{
   if (s>='a' && s<='z') return s-'a'+2;
   if (s>='A' && s<='Z') return s-'A'+2+26;
}

void getheight(int n)
{
    int i,j,k=0;
    for (i=0; i<=n; i++) rank[sa[i]]=i;

    for (i=0; i<n; i++)
    {
        if (k) k--;
        int j=sa[rank[i]-1];
        while(s[i+k]==s[j+k]) k++;
        height[rank[i]]=k;
    }
}

void build_ss(int m,int n)
{
    n++;
    int i,*x=t,*y=t2;
    for (int i=0; i<m; i++) c[i]=0;
    for (int i=0; i<n; i++) c[x[i]=s[i]]++;
    for (int i=1; i<m; i++) c[i]+=c[i-1];
    for (int i=n-1; i>=0; i--)
      sa[--c[x[i]]]=i;
    for (int k=1; k<=n; k<<=1)
    {
        int p=0;
        for (i=n-k; i<n; i++) y[p++]=i;
        for (i=0; i<n; i++) if (sa[i]>=k) y[p++]=sa[i]-k;

        for (i=0; i<m; i++) c[i]=0;
        for (i=0; i<n; i++) c[x[y[i]]]++;
        for (i=1; i<m; i++) c[i]+=c[i-1];
        for (i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
        swap(x,y);
        p=1;
        x[sa[0]]=0;
        for (i=1; i<n; i++)
        x[sa[i]]=(y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k])? p-1 : p++;
        if (p>=n) break;
        m=p;
    }
}
int d[maxn][22];
void RMQ_init()
{
    for (int i=1; i<=n; i++) d[i][0]=height[i];
     for (int j=1; (1<<j)<=n; j++)
      for (int i=1; (i+(1<<j)-1)<=n; i++)
      d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)
{
    if (L>R) swap(L,R);
    L++;

    int k=0;
    while((1<<(k+1))<=R-L+1) k++;
    return min(d[L][k],d[R-(1<<k)+1][k]);
}

void init()
{
    scanf("%s",s1);
    scanf("%s",s2);
    l1=strlen(s1);
    l2=strlen(s2);
    n=0;
    for (int i=0; i<l1; i++)
    s[n++]=idx(s1[i]);
    s[n++]=0;
    for (int i=0; i<l2; i++)
    s[n++]=idx(s2[i]);
    s[n]=1;
    memset(height,0,sizeof height);

    build_ss(60,n);
    getheight(n);
}
int num1[maxn],num2[maxn];
int st[maxn];
void slove()
{
    ans=0;
    memset(num1,0,sizeof num1);
    memset(num2,0,sizeof num2);
    for (int i=1; i<=n+1; i++)
    {
        num1[i]=num1[i-1];
        num2[i]=num2[i-1];
        if (sa[i]<l1) num1[i]++;
        if (sa[i]>l1 && sa[i]<n) num2[i]++;
        if (height[i]>height[i-1])
        {
            for (int j=height[i]; j>height[i-1]; j--)
            st[j]=i-1;
        }
        else if (height[i]<height[i-1])
        {
            int tp=max(m,height[i]+1);
            for (int j=tp; j<=height[i-1]; j++)
            {
                ll n1=num1[i-1]-num1[st[j]-1];
                ll n2=num2[i-1]-num2[st[j]-1];
                ans+=n1*n2;
            }
        }
    }
    printf("%lld\n",ans);
}
int main()
{
//    freopen("in.txt","r",stdin);
    while(~scanf("%d",&m) && m)
    {
       init();
       slove();
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值