图解
实例图解
目的
在匹配字符串的过程中,
相比暴力枚举遍历,避免了不必要的匹配(跳着往后"移"串),提高了时间复杂度。
求next[j]过程
递推来求,ne[j]一定比j小,且ne[1]=0(边界情况),大的j的ne[j]由小的j的ne[j]来递推。
对于串中每个下标为i的位置,先找到前i-1的next[],而后递推出ne[i]。
求ne[j]图解
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
KMP匹配过程
for (int i = 1, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];//找下一个位置
if (s[i] == p[j + 1]) j ++ ;
if (j == n)
{
//匹配成功
}
}
如果匹配成功后还需要找
j=ne[j]//可避免不必要的"后移",跳着"后移"
图解
模板题
给定一个字符串 S,以及一个模式串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 P 在字符串 S 中多次作为子串出现。
求出模式串 P 在字符串 S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N,表示字符串 P 的长度。
第二行输入字符串 P。
第三行输入整数 M,表示字符串 S 的长度。
第四行输入字符串 S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤N≤10^5
1≤M≤10^6
输入样例:
3
aba
5
ababa
输出样例:
0 2
代码
#include <bits/stdc++.h>
using namespace std;
const int N = 2000010;
int n,m;
int ne[N];
char p[N],s[N];
int main(){
std::ios::sync_with_stdio(false);
std::cin.tie(nullptr);
cin>>n>>p+1>>m>>s+1;
for(int i=2,j=0;i<=n;i++){
while(j&&p[i]!=p[j+1])j=ne[j];
if(p[i]==p[j+1])j++;
ne[i]=j;
}
for(int i=1,j=0;i<=m;i++){
while(j&&s[i]!=p[j+1])j=ne[j];
if(s[i]==p[j+1])j++;
if(j==n){
cout<<i-n<<' ';
j=ne[j];
}
}
return 0;
}