匹配统计
阿轩在纸上写了两个字符串,分别记为A和B。
利用在数据结构与算法课上学到的知识,他很容易地求出了“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。
不过阿轩是一个勤学好问的同学,他向你提出了Q个问题:
在每个问题中,他给定你一个整数x,请你告诉他有多少个位置,满足“字符串A从该位置开始的后缀子串”与B匹配的长度恰好为x。
例如:A=aabcde,B=ab,则A有aabcde、abcde、bcde、cde、de、e这6个后缀子串,它们与B=ab的匹配长度分别是1、2、0、0、0、0。
因此A有4个位置与B的匹配长度恰好为0,有1个位置的匹配长度恰好为1,有1个位置的匹配长度恰好为2。
输入格式
第一行输入三个整数N,M,Q,分别表示A串长度、B串长度、问题个数。
第二行输入字符串A,第三行输入字符串B。
接下来Q行每行输入1个整数x,表示一个问题。
输出格式
输出共Q行,依次表示每个问题的答案。
数据范围
1≤N,M,Q,x≤200000
输入样例:
6 2 5
aabcde
ab
0
1
2
3
4
输出样例:
4
1
1
0
0
1. 字符串 hash + 二分
#include <iostream>
#include <algorithm>
#include <cstring>
using namespace std;
typedef unsigned long long ULL;
const int N = 2e5 + 11;
const int P = 131;
char str1[N], str2[N];
ULL f1[N], f2[N], p[N];
int cnt[N];
int m, n, q;
ULL get(ULL f[], int l, int r) {
return f[r] - f[l - 1] * p[r - l + 1];
}
int main() {
cin >> n >> m >> q;
scanf("%s%s", str1 + 1, str2 + 1);
p[0] = 1;
for (int i = 1; i <= n; i ++) p[i] = p[i - 1] * P;
for (int i = 1; i <= n; i ++) f1[i] = f1[i - 1] * P + str1[i] - '0';
for (int i = 1; i <= m; i ++) f2[i] = f2[i - 1] * P + str2[i] - '0';
// 对于 str1 中的每个后缀,都二分求一下能匹配 str2 的最大前缀
for (int i = 1; i <= n; i ++) {
// 左边界为 i,右边界为 str2 的长度 + i
int l = i, r = i + m;
// 若最后右边界超过了 str1 的长度,则右边界变为 str1 的边界,因为 l 可以取到 n,所以 r = n + 1
if (r > n + 1) r = n + 1;
while (l < r) {
int mid = l + r >> 1;
// f2 的长度比较小,因此每次都应 mid - i,向上取整,所以 mid - i + 1
if (get(f1, i, mid) != get(f2, 1, mid - i + 1)) r = mid;
else l = mid + 1;
}
// r 是 a 与 b 匹配的最后一个字符, r - i 是后缀的起始下标
cnt[r - i] ++;
}
while (q --) {
int x;
cin >> x;
cout << cnt[x] << endl;
}
return 0;
}
2. kmp
#include <iostream>
#include <algorithm>
#include <cstring>
using namespace std;
const int N = 2e5 +11;
char a[N], b[N];
int ne[N], f[N], cnt[N];
int n, m, q;
void get_next() {
// next[i] 表示的是 b 中以 i 结尾的非前缀子串与 b 的前缀匹配的最大长度
for (int i = 2, j = 0; i <= m; i ++) {
while (j && b[i] != b[j + 1]) j = ne[j];
if (b[i] == b[j + 1]) j ++;
ne[i] = j;
}
}
int main() {
cin >> n >> m >> q;
scanf("%s%s", a + 1, b + 1);
get_next();
for (int i = 1, j = 0; i <= n; i ++) {
while (j && a[i] != b[j + 1]) j = ne[j];
if (a[i] == b[j + 1]) j ++;
// kmp 里面 f[i] 数组表示的是: a 中以 i 为结尾的字串,与 b 的前缀的最大匹配长度。
// 题意要求的求出“字符串A从任意位置开始的后缀子串”与“字符串B”匹配的长度。你不用管是那个前缀,你只需要知道前缀的匹配长度就行了,不过 f[i] 还可以继续往后匹配,直接算是不行的,
// 所以 cnt[i] 数组应该保存的是匹配长度小于等于 f[i] 的有多少种情况,所以for (int i = 1; i <= m; i ++) cnt[f[i]] ++;
// 不过有可能 f[i] 既可以匹配5位字符,又可以匹配3位字符,
// 那么你就应该都算上去啊,所以 cnt[i] 数组应该保存的是匹配长度小于等于 i 的有多少种情况,
// 但是你刚刚少算了一些情况的嘛,所以for (int i = m; i; i –-) cnt[ne[i]] += cnt[i];
// 最后答案就是 cnt[x] - cnt[x + 1];
f[i] = j;
cnt[f[i]] ++;
}
for (int i = m; i; i --) cnt[ne[i]] += cnt[i];
while (q --) {
int x;
cin >> x;
cout << cnt[x] - cnt[x + 1] << endl;
}
return 0;
}