kmp应用

匹配统计

阿轩在纸上写了两个字符串,分别记为A和B。

利用在数据结构与算法课上学到的知识,他很容易地求出了“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。

不过阿轩是一个勤学好问的同学,他向你提出了Q个问题:

在每个问题中,他给定你一个整数x,请你告诉他有多少个位置,满足“字符串A从该位置开始的后缀子串”与B匹配的长度恰好为x。

例如:A=aabcde,B=ab,则A有aabcde、abcde、bcde、cde、de、e这6个后缀子串,它们与B=ab的匹配长度分别是1、2、0、0、0、0。

因此A有4个位置与B的匹配长度恰好为0,有1个位置的匹配长度恰好为1,有1个位置的匹配长度恰好为2。

输入格式

第一行输入三个整数N,M,Q,分别表示A串长度、B串长度、问题个数。

第二行输入字符串A,第三行输入字符串B。

接下来Q行每行输入1个整数x,表示一个问题。

输出格式

输出共Q行,依次表示每个问题的答案。

数据范围

1≤N,M,Q,x≤200000

输入样例:
6 2 5
aabcde
ab
0
1
2
3
4
输出样例:
4
1
1
0
0
1. 字符串 hash + 二分
#include <iostream>
#include <algorithm>
#include <cstring>

using namespace std;

typedef unsigned long long ULL;

const int N = 2e5 + 11;
const int P = 131; 

char str1[N], str2[N];
ULL f1[N], f2[N], p[N];
int cnt[N];
int m, n, q;

ULL get(ULL f[], int l, int r) {
    return f[r] - f[l - 1] * p[r - l + 1];
}

int main() {
    cin >> n >> m >> q;
    scanf("%s%s", str1 + 1, str2 + 1);
    
    p[0] = 1;
    
    for (int i = 1; i <= n; i ++) p[i] = p[i - 1] * P;
    for (int i = 1; i <= n; i ++) f1[i] = f1[i - 1] * P + str1[i] - '0';
    for (int i = 1; i <= m; i ++) f2[i] = f2[i - 1] * P + str2[i] - '0';
    
    // 对于 str1 中的每个后缀,都二分求一下能匹配 str2 的最大前缀
    for (int i = 1; i <= n; i ++) {
        // 左边界为 i,右边界为 str2 的长度 + i
        int l = i, r = i + m;
        // 若最后右边界超过了 str1 的长度,则右边界变为 str1 的边界,因为 l 可以取到 n,所以 r = n + 1
        if (r > n + 1) r = n + 1;
        while (l < r) {
            int mid = l + r >> 1;
            // f2 的长度比较小,因此每次都应 mid - i,向上取整,所以 mid - i + 1
            if (get(f1, i, mid) != get(f2, 1, mid - i + 1)) r = mid;
            else l = mid + 1;
        }
        // r 是 a 与 b 匹配的最后一个字符, r - i 是后缀的起始下标
        cnt[r - i] ++;
    }
    
    while (q --) {
        int x;
        cin >> x;
        cout << cnt[x] << endl;
    }
    return 0;
}


2. kmp
#include <iostream>
#include <algorithm>
#include <cstring>

using namespace std;

const int N = 2e5 +11;

char a[N], b[N];
int ne[N], f[N], cnt[N];
int n, m, q;

void get_next() {
	// next[i] 表示的是 b 中以 i 结尾的非前缀子串与 b 的前缀匹配的最大长度
    for (int i = 2, j = 0; i <= m; i ++) {
        while (j && b[i] != b[j + 1]) j = ne[j];
        if (b[i] == b[j + 1]) j ++;
        ne[i] = j;
    }
}

int main() {
    cin >> n >> m >> q;
    scanf("%s%s", a + 1, b + 1);
    get_next();
    
    for (int i = 1, j = 0; i <= n; i ++) {
        while (j && a[i] != b[j + 1]) j = ne[j];
        if (a[i] == b[j + 1]) j ++;
        // kmp 里面 f[i] 数组表示的是: a 中以 i 为结尾的字串,与 b 的前缀的最大匹配长度。
        // 题意要求的求出“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。你不用管是那个前缀,你只需要知道前缀的匹配长度就行了,不过 f[i] 还可以继续往后匹配,直接算是不行的,
        // 所以 cnt[i] 数组应该保存的是匹配长度小于等于 f[i] 的有多少种情况,所以for (int i = 1; i <= m; i ++) cnt[f[i]] ++;
        // 不过有可能 f[i] 既可以匹配5位字符,又可以匹配3位字符,
        // 那么你就应该都算上去啊,所以 cnt[i] 数组应该保存的是匹配长度小于等于 i 的有多少种情况,
        // 但是你刚刚少算了一些情况的嘛,所以for (int i = m; i; i –-) cnt[ne[i]] += cnt[i];
        // 最后答案就是 cnt[x] - cnt[x + 1];
        f[i] = j;
        cnt[f[i]] ++;
    }
    
    for (int i = m; i; i --) cnt[ne[i]] += cnt[i];
    
    while (q --) {
        int x;
        cin >> x;
        cout << cnt[x] - cnt[x + 1] << endl;
    }
    return 0;
}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值