kmp应用

最新推荐文章于 2024-08-14 11:57:07 发布

置顶 acw_tako

最新推荐文章于 2024-08-14 11:57:07 发布

阅读量208

点赞数 1

分类专栏：模板题文章标签：算法字符串

本文链接：https://blog.csdn.net/LiAiZu/article/details/113115311

版权

模板题专栏收录该内容

9 篇文章 0 订阅

订阅专栏

匹配统计

阿轩在纸上写了两个字符串，分别记为A和B。

利用在数据结构与算法课上学到的知识，他很容易地求出了“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。

不过阿轩是一个勤学好问的同学，他向你提出了Q个问题：

在每个问题中，他给定你一个整数x，请你告诉他有多少个位置，满足“字符串A从该位置开始的后缀子串”与B匹配的长度恰好为x。

例如：A=aabcde，B=ab，则A有aabcde、abcde、bcde、cde、de、e这6个后缀子串，它们与B=ab的匹配长度分别是1、2、0、0、0、0。

因此A有4个位置与B的匹配长度恰好为0，有1个位置的匹配长度恰好为1，有1个位置的匹配长度恰好为2。

输入格式

第一行输入三个整数N,M,Q，分别表示A串长度、B串长度、问题个数。

第二行输入字符串A，第三行输入字符串B。

接下来Q行每行输入1个整数x，表示一个问题。

输出格式

输出共Q行，依次表示每个问题的答案。

数据范围

1≤N,M,Q,x≤200000

输入样例：

6 2 5
aabcde
ab
0
1
2
3
4

输出样例：

1. 字符串 hash + 二分

#include <iostream>
#include <algorithm>
#include <cstring>

using namespace std;

typedef unsigned long long ULL;

const int N = 2e5 + 11;
const int P = 131; 

char str1[N], str2[N];
ULL f1[N], f2[N], p[N];
int cnt[N];
int m, n, q;

ULL get(ULL f[], int l, int r) {
    return f[r] - f[l - 1] * p[r - l + 1];
}

int main() {
    cin >> n >> m >> q;
    scanf("%s%s", str1 + 1, str2 + 1);
    
    p[0] = 1;
    
    for (int i = 1; i <= n; i ++) p[i] = p[i - 1] * P;
    for (int i = 1; i <= n; i ++) f1[i] = f1[i - 1] * P + str1[i] - '0';
    for (int i = 1; i <= m; i ++) f2[i] = f2[i - 1] * P + str2[i] - '0';
    
    // 对于 str1 中的每个后缀，都二分求一下能匹配 str2 的最大前缀
    for (int i = 1; i <= n; i ++) {
        // 左边界为 i，右边界为 str2 的长度 + i
        int l = i, r = i + m;
        // 若最后右边界超过了 str1 的长度，则右边界变为 str1 的边界，因为 l 可以取到 n，所以 r = n + 1
        if (r > n + 1) r = n + 1;
        while (l < r) {
            int mid = l + r >> 1;
            // f2 的长度比较小，因此每次都应 mid - i，向上取整，所以 mid - i + 1
            if (get(f1, i, mid) != get(f2, 1, mid - i + 1)) r = mid;
            else l = mid + 1;
        }
        // r 是 a 与 b 匹配的最后一个字符， r - i 是后缀的起始下标
        cnt[r - i] ++;
    }
    
    while (q --) {
        int x;
        cin >> x;
        cout << cnt[x] << endl;
    }
    return 0;
}

2. kmp

#include <iostream>
#include <algorithm>
#include <cstring>

using namespace std;

const int N = 2e5 +11;

char a[N], b[N];
int ne[N], f[N], cnt[N];
int n, m, q;

void get_next() {
	// next[i] 表示的是 b 中以 i 结尾的非前缀子串与 b 的前缀匹配的最大长度
    for (int i = 2, j = 0; i <= m; i ++) {
        while (j && b[i] != b[j + 1]) j = ne[j];
        if (b[i] == b[j + 1]) j ++;
        ne[i] = j;
    }
}

int main() {
    cin >> n >> m >> q;
    scanf("%s%s", a + 1, b + 1);
    get_next();
    
    for (int i = 1, j = 0; i <= n; i ++) {
        while (j && a[i] != b[j + 1]) j = ne[j];
        if (a[i] == b[j + 1]) j ++;
        // kmp 里面 f[i] 数组表示的是: a 中以 i 为结尾的字串，与 b 的前缀的最大匹配长度。
        // 题意要求的求出“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。你不用管是那个前缀，你只需要知道前缀的匹配长度就行了，不过 f[i] 还可以继续往后匹配，直接算是不行的，
        // 所以 cnt[i] 数组应该保存的是匹配长度小于等于 f[i] 的有多少种情况，所以for (int i = 1; i <= m; i ++) cnt[f[i]] ++;
        // 不过有可能 f[i] 既可以匹配5位字符，又可以匹配3位字符，
        // 那么你就应该都算上去啊，所以 cnt[i] 数组应该保存的是匹配长度小于等于 i 的有多少种情况，
        // 但是你刚刚少算了一些情况的嘛，所以for (int i = m; i; i –-) cnt[ne[i]] += cnt[i];
        // 最后答案就是 cnt[x] - cnt[x + 1];
        f[i] = j;
        cnt[f[i]] ++;
    }
    
    for (int i = m; i; i --) cnt[ne[i]] += cnt[i];
    
    while (q --) {
        int x;
        cin >> x;
        cout << cnt[x] - cnt[x + 1] << endl;
    }
    return 0;
}

acw_tako

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kmp应用

匹配统计阿轩在纸上写了两个字符串，分别记为A和B。利用在数据结构与算法课上学到的知识，他很容易地求出了“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。不过阿轩是一个勤学好问的同学，他向你提出了Q个问题：在每个问题中，他给定你一个整数x，请你告诉他有多少个位置，满足“字符串A从该位置开始的后缀子串”与B匹配的长度恰好为x。例如：A=aabcde，B=ab，则A有aabcde、abcde、bcde、cde、de、e这6个后缀子串，它们与B=ab的匹配长度分别是1、2、0、0、0、0。因
复制链接

扫一扫