acwing
kmp
题目描述
给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式
第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串M。
输出格式
共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。
数据范围
1≤N≤10^4
1≤M≤10^5
输入样例
3
aba
5
ababa
输出样例
0 2
这是一道典型的kmp算法,关键在于求next(前后缀表)
next中最难理解的就是 j=next[j] 这里也是求前后缀。
具体看下面链接,
对kmp算法的理解链接
模板串下标从0开始的
/*
* @Author: lzyws739307453
* @Language: C++
*/
#include <bits/stdc++.h>
using namespace std;
const int MAXN = 1e4 + 5;
const int MAXM = 1e5 + 5;
int nex[MAXN];
char p[MAXN], s[MAXM];
void Get_Next(char str[], int len) {
int i = 0, j = -1;
nex[0] = -1;
while (i < len) {
if (~j && str[i] != str[j])
j = nex[j];
else nex[++i] = ++j;
}
}
void KMP(char sa[], int la, char sb[], int lb) {
Get_Next(sb, lb);
int i = 0, j = 0;
while (i < la) {
if (~j && sa[i] != sb[j])
j = nex[j];
else i++, j++;
if (j >= lb) {
j = nex[j];
printf("%d ", i - lb);
}
}
}
int main() {
int n, m;
scanf("%d%s%d%s", &n, p, &m, s);
KMP(s, m, p, n);
printf("\n");
return 0;
}
从1开始的模板
#include<iostream>
#include<cstdio>
using namespace std;
const int N= 1e5 + 10,M=1e6+10;
int n, m;
int ne[N]; //next数组,next[i]表示子串s[1,2,,,,,,i-1,i]的最长相等前后缀的前缀最后一位下标
//或者说是子串的最长相等前后缀的长度,因为我们是从下标1开始的,这也体现出了从1开始的好处
char s[M]; //模式串
char p[N]; //模板串
int main()
{
cin >> n >> p + 1 >> m >> s + 1; //下标从1开始
for (int i = 2, j = 0; i <= n; i++) //求next数组 next[1]=0,因此从2开始
{
while (j&&p[i] != p[j + 1]) j = ne[j]; //p[i] != p[j + 1]匹配失败,j回退
if (p[i] == p[j + 1]) j++; //匹配成功,ne[i]=j+1,先令j指向这个位置
ne[i] = j;
}
for(int i=1,j=0;i<=m;i++) //由于s[i]和p[j+1]匹配,因此j要往前错一位从0开始
{
while (j&&s[i] != p[j + 1]) j = ne[j];//此时next数组的含义就是当j+1位失配时,j应该退回的位置
if (s[i] == p[j + 1]) j++;//匹配成功,j++指向下一个位置
if (j == n) //匹配到模板串尽头,输出位置
{
printf("%d ", i - n);
j = ne[j]; //让j回退到next[j]继续下一次匹配
}
}
return 0;
}
//来源·https://blog.csdn.net/weixin_45629285/article/details/107821878