题意:
求文本串中有多少个模式串。
思路:
kmp算法是ac自动机的基础,其实质就是建立一个自动机,让文本串在自动机上运行。其中最关键的就是next数组,对于这个一定要深刻理解。
next[i]数组所表达的含义就是对于第i个字符来说,前i-1个字符中最大的前缀和后缀能匹配上的长度。
举个例子:abcdabd,最后一个字符d的前缀是abcdab,可以发现这里面最长的能自由匹配的前缀和后缀是ab,所以next[d] = 2;这样就可以减少很多不必要的比较。而构造自动机的过程其实就是计算模式串next数组的过程,这个过程可以通过递推来实现。
代码:
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
const int MAXN = 1e6 + 10;
int n, m;
char s[MAXN], t[MAXN];
int Next[MAXN];
void getNext() {
Next[0] = Next[1] = 0;
for (int i = 1; i < m; i++) {
int j = Next[i];
while (j && t[i] != t[j]) j = Next[j];
Next[i + 1] = (t[i] == t[j]) ? j + 1 : 0;
}
}
int kmp() {
getNext();
int j = 0, res = 0;
for (int i = 0; i < n; i++) {
while (j && s[i] != t[j]) j = Next[j];
//printf("%d : %d\n", i, j);
if (s[i] == t[j]) ++j;
if (j == m) ++res;
}
return res;
}
int main() {
int T;
scanf("%d", &T);
while (T--) {
scanf("%s%s", t, s);
n = strlen(s); m = strlen(t);
printf("%d\n", kmp());
}
return 0;
}