题目描述
给定一个模式串 S,以及一个模板串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串 P 在模式串 S 中多次作为子串出现。
求出模板串 P 在模式串 S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N,表示字符串 P 的长度。
第二行输入字符串 P。
第三行输入整数 M,表示字符串 S 的长度。
第四行输入字符串 S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤N≤10^5
1≤M≤10^6
输入样例:
3
aba
5
ababa
输出样例:
0 2
思路
本题的思路先不总结了,然后这是自己参考别人视频理解的,花了太多时间了,以后有时间自己再总结一遍加深印象。这里分享一下我理解KMP时看的一些视频,个人觉得看视频里面的动态变化图更好理解。
KMP算法原理
一、KMP匹配
KMP 算法永不回退 s数组的指针 i,不走回头路,而是借助 s 数组中储存的信息把 p 移到正确的位置继续匹配,时间复杂度只需 O(N),用空间换时间,所以我认为它是一种动态规划算法。
上面蓝色部分对应s数组,即源串,黄色部分对应p数组,即模式串。
二、求next数组
参考视频:https://www.bilibili.com/video/BV16X4y137qw?spm_id_from=333.337.search-card.all.click
next数组计算
next数组的值为模式串当前位置前面子串与相对应主串的最长公共前后缀长度。
代码
原理解释
代码示例
代码参考acwing
#include <iostream>
using namespace std;
const int N = 1e5 + 10;
const int M = 1e6 + 10;
int ne[N];
char p[N], s[M];
int main()
{
int n, m;
// p和s下标从1开始
cin >> n >> p + 1>> m >> s + 1;
// 求next数组(与kmp类似)
for(int i = 2, j = 0; i <= n; i++)
{
// 这里匹配当前下表i对应j的下一个值是不是相等:如果相等则当前的j加1即可 如果不相等
// 如果不相等的话,则继续ne[ne[j]]的前面找,知道找到最长前后缀长度;
while(j && p[i] != p[j+1]) j = ne[j];
if(p[i] == p[j + 1]) j ++;
ne[i] = j;
}
// kmp 匹配过程
for(int i = 1, j = 0; i <= m; i ++)
{
while(j && s[i] != p[j+1]) j = ne[j];
if(s[i] == p[j + 1]) j ++;
if(j == n)
{
cout << i - n << ' ';
j = ne[j];
}
}
return 0;
}