POJ 3415 Common Substrings

题意:找到两个字符串所有长度大于k的公共子串个数。
题解:我们需要用到后缀数组,我们已经知道一个字符串的所有子串都是这个字符串所有后缀的前缀,所以我们这题只需要枚举A串的所有后缀对B串每个后缀的贡献。举个例子:如果A串为:abab,B串为abb。我们算A串一个后缀 – ab 的贡献需要与B串每个后缀算公共前缀的长度。这样复杂度是过不去的,所以我们需要优化。
我们知道height数组可以将这些后缀都分组,我们需要知道一个性质,如果已知一些后缀是一组,那么height数组大小的变化规律一定是 小 -> 大 -> 小,所以我们可以用单调栈优化,一定要理解为什么可以用单调栈优化。
首先我们知道贡献只会在一组内才能够被计算,不可能两个不同的组会有贡献,我们又知道height数组的大小一定是 小->大->小。我们维护一个单调递增的栈,那么对于大->小的这部分贡献就能计算了。具体看代码实现。

#include<cstring>
#include<cstdio>
#include<algorithm>
#include<iostream>
using namespace std;
typedef long long ll;
const int N=200010;
int wa[N],wb[N],wv[N],wss[N],cal[N];
int rak[N],height[N],sa[N];
char s[N*2];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
//sa
void da(int *r,int *sa,int n,int M) {
     int i,j,p,*x=wa,*y=wb,*t;
     for(i=0;i<M;i++) wss[i]=0;
     for(i=0;i<n;i++) wss[x[i]=r[i]]++;
     for(i=1;i<M;i++) wss[i]+=wss[i-1];
     for(i=n-1;i>=0;i--) sa[--wss[x[i]]]=i;
     for(j=1,p=1;p<n;j*=2,M=p) {
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<M;i++) wss[i]=0;
        for(i=0;i<n;i++) wss[wv[i]]++;
        for(i=1;i<M;i++)wss[i]+=wss[i-1];
        for(i=n-1;i>=0;i--) sa[--wss[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
     }
     return;
}
//height
void calheight(int *r,int *sa,int n) {
     int i,j,k=0;
     for(i=1;i<=n;i++) rak[sa[i]]=i;
     for(i=0;i<n;height[rak[i++]]=k)
     for(k?k--:0,j=sa[rak[i]-1];r[i+k]==r[j+k];k++);
     for(int i=n;i;i--)rak[i]=rak[i-1],sa[i]++;
}

int n ;
//RMQ
int lg[N], bin[30], d[32][N];
void rmq() {
    bin[0]=1;lg[0]=-1;
   for(int i=1;i<=30;i++)bin[i]=(bin[i-1]<<1);
    for(int i=1;i < N;i++)lg[i]=lg[i>>1]+1;
    int t = lg[n];
    for(int i=1;i<=n;i++)d[0][i]=height[i];
    for(int i=1;i<=t;i++)
        for(int j=1;j+bin[i]-1<=n;j++)
            d[i][j] = min(d[i-1][j], d[i-1][j+bin[i-1]]);
}
int query(int a, int b) {
   a = rak[a], b = rak[b];
    if (a > b) swap(a, b); ++a;
    int t = lg[b-a+1];
    return min(d[t][a], d[t][b-bin[t]+1]);
}
int c = 0,len1,len2,k;
ll sum[3];
int pre[N*2],a[N*2];
ll sovle()
{
    ll ans  = 0;
    int now = 0 ;
    for(int i=1;i<=c;i++)
    {
        if(height[i] < k)
        {
            memset(sum,0,sizeof(sum));
            now = 0;
            continue ;
        }
        int j = now - 1;
        for(;j>=0&&a[j]>height[i]-k+1;j--)
        {
            sum[pre[j]] += height[i] - k + 1 - a[j];
            a[j] = height[i] - k + 1;
        }
        if(sa[i-1]<=len1) pre[now] = 1;
        if(sa[i-1]>len1) pre[now] = 2;
        sum[pre[now]] += height[i] - k + 1;
        a[now] = height[i] - k + 1;
        int t;
        if(sa[i]<=len1) t = 1;
        if(sa[i]>len1) t = 2;

        ans += sum[3-t];
        now ++ ;
    }
    return ans ;
}
char s1[N],s2[N];
int main()
{
    int cas = 1;
   while(~scanf("%d",&k)&&k)
   {
     scanf("%s%s",s1+1,s2+1);
     len1 = strlen(s1+1) , len2 = strlen(s2+1);
    c = 0 ;
    for(int i=1;i<=len1;i++) s[++c] = s1[i];
    s[++c] = '#';
    for(int i=1;i<=len2;i++) s[++c] = s2[i];
    for(int i=1;i<=c;i++) cal[i] = s[i];
        cal[c+1]=0;
        da(cal+1,sa,c+1,200);
        calheight(cal+1,sa,c);

      printf("%lld\n",sovle());
   }

}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值