poj3415 Common Substrings

Common Substrings

Description

给定两个字符串A和B,求长度不小于k的公共子串的个数。
字符串长度小于等于 105

Input

输入数据有多组
每组数据第一行一个正整数k,之后两行是字符串A、B。
输入以一个k=0结束。

Output

每组数据输出一个正整数,表示公共子串个数。

Sample Input

2
aababaa
abaabaa
1
xx
xx
0

Sample Output

22
5

题解

一道算是比较难的论文题,卡了好久。
将两个字符串用一个未出现过的字符连接起来,求出sa,rank,height。然后按照height值分组(连续的大于等于k的分在一组),接下来就只需要对于每一个B的后缀求与前面的A的后缀能产生多少个长度不小于k的公共子串,再对A做一遍相同的事情。若两个串最长公共前缀的长度为L,那么对答案产生 Lk+1 的贡献。
这里直接扫描会T,考虑到最长公共前缀是一个区间最小值的操作。所以维护一个二维的栈(单调),一维表示height值(这里单调),一维表示系数。再同一组中,若循环到当前的sa[i-1]属于A串,那么系数++,若当前的height值小于栈中已有的一些height值,可以将所有大于当前height的栈中元素压到一个栈元素里去因为若后面再次计算最长公共前缀用到的最小值一定不是那些元素了(已经有了一个比他们小),而系数就是这些元素的系数的累加,height值为当前height值。那么怎么统计最长公共前缀呢。维护一个tot,每次遇到sa[i-1]属于A串时就将tot更新(加上 height[i]k+1 ),在压缩栈元素的时候,将多出来的减掉,在遇到一个sa[i]属于B时将tot累加进ans即可。
对于A串和前面的所有B串用同样的操作。

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
#define ll long long
using namespace std;

const int N = 200000 + 10;
char ss[N];
int a[N], sa[2][N], rk[2][N], ht[N], v[N], s[N][2];
int n, p, q, k, df, K;
bool init(){
    scanf("%d", &K);
    if(!K) return false;
    scanf("%s", ss+1);
    memset(a, 0, sizeof(a));
    int len = strlen(ss+1);
    for(int i = 1; i <= len; i++) a[i] = (int) ss[i];
    df = len + 1;
    a[df] = (int) '$';
    scanf("%s", ss+1);
    n = strlen(ss+1) + len + 1;
    for(int i = len + 2; i <= n; i++) a[i] = (int) ss[i-len-1];
    memset(sa, 0, sizeof(sa)); memset(rk, 0, sizeof(rk)); memset(ht, 0, sizeof(ht)); memset(v, 0, sizeof(v));
}

void calsa(int *sa1, int *rk1, int *sa2, int *rk2){
    for(int i = 1; i <= n; i++) v[rk1[sa1[i]]] = i;
    for(int i = n; i >= 1; i--) if(sa1[i] > k) sa2[v[rk1[sa1[i]-k]]--] = sa1[i] - k;
    for(int i = n-k+1; i <= n; i++) sa2[v[rk1[i]]--] = i;
    for(int i = 1; i <= n; i++) rk2[sa2[i]] = rk2[sa2[i-1]] +
        (rk1[sa2[i]] != rk1[sa2[i-1]] || rk1[sa2[i]+k] != rk1[sa2[i-1]+k]);
}
void calht(){
    int k = 0;
    for(int i = 1; i <= n; i++){
        if(k) k--;
        int j = sa[p][rk[p][i]-1];
        while(a[i+k] == a[j+k]) k++;
        ht[rk[p][i]] = k;
    }
}
void work(){
    while(init()){
        p = 0, q = 1, k = 1;
        for(int i = 1; i <= n; i++) v[a[i]]++;
        for(int i = 1; i <= 130; i++) v[i] += v[i-1];
        for(int i = 1; i <= n; i++) sa[p][v[a[i]]--] = i;
        for(int i = 1; i <= n; i++) rk[p][sa[p][i]] = rk[p][sa[p][i-1]] + (a[sa[p][i]] != a[sa[p][i-1]]);
        memset(v, 0, sizeof(v));
        while(k < n){
            calsa(sa[p], rk[p], sa[q], rk[q]);
            p ^= 1, q ^= 1, k <<= 1;
        }
        calht();
        memset(s, 0, sizeof(s));
        ll tot = 0, top = 0;
        ll sum = 0;
        for(int i = 1; i <= n; i++){
            if(ht[i] < K) top = tot = 0;
            else{
                int cnt = 0;
                if(sa[p][i-1] < df) cnt++, tot += ht[i] - K + 1;
                while(top > 0 && ht[i] <= s[top-1][0]){
                    top--;
                    tot -= s[top][1] * (s[top][0] - ht[i]);
                    cnt += s[top][1];
                }
                s[top][0] = ht[i]; s[top++][1] = cnt;
                if(sa[p][i] > df) sum += tot;
            }
        }
        tot = top = 0;
        for(int i = 1; i <= n; i++){
            if(ht[i] < K) top = tot = 0;
            else{
                int cnt = 0;
                if(sa[p][i-1] > df) cnt++, tot += ht[i] - K + 1;
                while(top > 0 && ht[i] <= s[top-1][0]){
                    top--;
                    tot -= s[top][1] * (s[top][0] - ht[i]);
                    cnt += s[top][1];
                }
                s[top][0] = ht[i]; s[top++][1] = cnt;
                if(sa[p][i] < df) sum += tot;
            }
        }
        cout<<sum<<endl;
    }
}

int main(){
    work();
    return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值