题目:acwing831
给定一个字符串 S,以及一个模式串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 P在字符串 S中多次作为子串出现。
求出模式串 P 在字符串 S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N,表示字符串 P 的长度。
第二行输入字符串 P。
第三行输入整数 M,表示字符串 S 的长度。
第四行输入字符串 S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 00 开始计数),整数之间用空格隔开。
数据范围
1≤N≤10^5
1≤M≤10^6
分析题目,我们先用暴力的思想计算:假设我们需要寻找的是字符串a,比对的是字符串b,将字符串a的每一位与输入字符串b进行比对,如果比对错误,那么就直接重新比对。这样的思路固然简单,但是会大大提升时间复杂度。
那我们该如何简化算法呢?
假设我们字符串a是aaaaaaaf,字符串b是aaaaaaaaaaaaaaaaaf,如果采用暴力匹配法,那么我们将要一次次重复遍历。但是我们已经知道了前面字符串b前几位的数字,那么我们该如何简化?
具体请参照下面的视频,本文一时半会讲不清楚,绝对不是因我也不是很清楚。
#include<iostream>
using namespace std;
const int N = 10010; const int M = 10010;
int n, m;
char p[N], s[M];
int ne[N];
int main() {
cin >> n >> p + 1 >> m >> s + 1;
//求next数列
for (int i = 2, j = 0; i <= n; i++) {
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j++;
ne[i] = j;
}
//求kmp配对
for (int i = 1, j = 0; i <= m; i++) {
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j++;
if (j == n) {
cout << i - n;
j = ne[j];
}
}
return 0;
}
实际上,我们做题目就不需要知道kmp算法的原理(实际上我也很难深入了解,事无巨细地说出细节和原因),我们只需要记住细节和思路,能够复刻出代码就行了。
首先我们需要计算出next数组,根据视频中提出的思路,我们首先要计算出next数组,cin>>p+1>>s+1的意思是从p[1]和s[1]的位置开始存储字符串。
接下来的一个for循环是来求字符的next数组的,最后的一个for循环则是进行kmp算法配对的。