题目
给定一个字符串 SS,以及一个模式串 PP,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 PP 在字符串 SS 中多次作为子串出现。
求出模式串 PP 在字符串 SS 中所有出现的位置的起始下标。
输入格式
第一行输入整数 NN,表示字符串 PP 的长度。
第二行输入字符串 PP。
第三行输入整数 MM,表示字符串 SS 的长度。
第四行输入字符串 SS。
输出格式
共一行,输出所有出现位置的起始下标(下标从 00 开始计数),整数之间用空格隔开。
数据范围
1≤N≤1051≤N≤105
1≤M≤1061≤M≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
分析
1.什么是KMP算法
1.1 KMP是一种在任何情况下都能达到 O(n + m) 复杂度的算法。
1.2 用KMP算法时,指向 S 的 i 指针不会回溯,而 是一直往后走到底。与朴素方法比较,大大加快 了匹配速度。
2.预处理串p---求next数组(利用next【i】和next【i-1】的递推关系)
若next【i-1】= j
2.1 如果p[i] = p[j+1],那么next【ℹ️】= j + 1
2.2 如果p[i] != p[j+1]
① j = next[j]; //j后退
② 再比较
p[i]
和
新的
p[j + 1]
是否相等
•如果相等,则
next[i] = j + 1
。
•否则,返回① j继续后退, 直到j退无可退
for(int i=2; i<=n; i++)
{
while(j && p[j+1] != p[i]) j = next[j];
if(p[j+1] == p[i]) j++;
next[i] = j;
}
3.KMP匹配过程
3.1 当s[i]与p[j+1]不匹配时,串p向右移动,即j=next[j], 若s[i]与p[j+1]仍不匹配,j继续找next【j】,直至j等于0.
3.2 当s[i]与p[j+1]匹配时,j++;
3.3 如果j=n,表示匹配成功,j=next【j】
for (int i = 1, j = 0; i <= m; i ++ )
{
while ( j && s[i] != p[j + 1] ) j = next[j];
if ( s[i] == p[j + 1] ) j ++;
if (j == n) //匹配成功
{
printf("%d ", i - n);
j = next[j];
}
}
代码
#include <iostream>
using namespace std;
const int N=100010;
const int M=1000010;
char p[N], s[M], ne[N];
int n, m;
int main()
{
cin >> n >> p+1 >> m >> s+1;//下标从1开始
//预处理串p,i从2开始,只有两个及两个以上的字符串才有前后缀
for(int i=2, j=0; i<=n; i++)
{
while(j && p[i] != p[j+1]) j=ne[j];
if(p[i] == p[j+1]) j++;
//ne[]记录前缀能有多长
ne[i] = j;
}
//KMP配对
for(int i=1, j=0; i<=m; i++)
{
while(j && s[i]!=p[j+1]) j = ne[j];
if(s[i] == p[j+1]) j++;
//kmp记录p能否走到终点
if(j == n) {
//如:输出以0开始的匹配子串的首字母下标
//printf("%d ", i - m); (若输出要求从1开始,加1)
printf("%d ", i-n); //I-N+1-1
j=ne[j]; //再次继续匹配
}
}
return 0;
}