KMP算法
本文中所有的字符串下标都从1开始
KMP匹配的过程
KMP求next数组过程
- 由KMP匹配的过程中可以知道,我们需要求最长的一组前缀、后缀,以便我们可以跳过匹配过程中重复的地方。
next
数组用于记录最长的一组前缀、后缀中,前缀的最后一个字符的位置,用于后续匹配过程中,直接跳到该位置处,继续匹配。- 用一个实例来演示一下求
next
数组的过程。
题目
给定一个字符串 S S S,以及一个模式串 P P P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 P P P 在字符串 S S S 中多次作为子串出现。
求出模式串 P P P 在字符串 S S S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N N N,表示字符串 P P P 的长度。
第二行输入字符串 P P P。
第三行输入整数 M M M,表示字符串 S S S 的长度。
第四行输入字符串 S S S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 0 0 开始计数),整数之间用空格隔开。
数据范围
1
≤
N
≤
1
0
5
1 \le N \le 10^5
1≤N≤105
1
≤
M
≤
1
0
6
1 \le M \le 10^6
1≤M≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
代码
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
const int N = 1e5 + 10, M = 1e6 + 10;
char s[M], p[N];
int ne[N];
int n, m;
int main()
{
cin >> n >> p + 1 >> m >> s + 1;
// 求next数组
for (int j = 0, i = 2; i <= n; i ++ )
{
while (j && p[j + 1] != p[i]) j = ne[j];
if (p[j + 1] == p[i]) j ++ ;
ne[i] = j;
}
// kmp匹配
for (int j = 0, i = 1; i <= m; i ++ )
{
while (j && p[j + 1] != s[i]) j = ne[j];
if (p[j + 1] == s[i]) j ++ ;
if (j == n)
{
cout << i - n << " ";
j = ne[j];
}
}
}