kmp
一、对kmp的理解
嗯——kmp对我来说是在一个字符串(模式串s)中找到另一个字符串(模板串p)
第一种我们容易想到的就是暴力求解法。
这种方法也叫朴素的模式匹配:
简单来说就是:从串s 和串p 的第一个字符开始,将两字符串的字符一一比对,如果出现某个字符不匹配,主串回溯到第二个字符,子串回溯到第一个字符再进行一一比对。如果出现某个字符不匹配,主串回溯到第三个字符,子串回溯到第一个字符再进行一一比对…一直到子串字符全部匹配成功。
大家可能会想:这个方法也太慢了吧!求一个子串位置需要太多的步骤。而且很多步骤根本不必要进行。(不你错了,你走吧 )
没错你是对的。
so
二、匹配(附代码)
例如p串到了这个位置,开始找,找到j这个位置时他的下一位j+1和与它对齐的i不相等(前面都相等),运用ne找到ne[j](圈1的右边界),然后j = ne[j](这就是相当于整串后移了), 如此往复,直到s[i] = p[j + 1]。
在这里面运用ne使 1串=2串,又因为 2串=3串,所以 1串=3串,so后退之后可以保证p[1~ne[j]] = p[j-ne[j]+1~j];
最后当j=m时就匹配成功
代码如下
for (int i = 1, j = 0; i <= m; ++ i)
{
while (j && s[i] != p[j + 1])
j = ne[j];
if (s[i] == p[j + 1]) j ++;
if(j == n)//成功匹配
{
balabala
j = ne[j];
}
}
代码中
j = ne[j];
表示要继续往后找更多匹配的。
j从0开始,因为是j+1与i比较
三、next
理解了上面,这个就比较简单了,因为上面是s匹配p,这里是p匹配p
所以代码基本一样,只是要注意ne[1] = 0,所以i要从2开始,j照常从0开始
代码如下
for (int i = 2, j = 0; i <= n; ++ i)
{
while (j && p[i] != p[j + 1])
j = ne[j];
if (p[i] == p[j + 1]) j ++;
ne[i] = j;
}
四、完整代码(此题的,请勿抄袭)
#include <bits/stdc++.h>
using namespace std;
int n, m;
char s[100010], p[1000010];
int ne[100010];
int main()
{
//freopen("a.in", "r", stdin);
//freopen("a.out", "w", stdout);以防万一,养成习惯
cin >> n >> p + 1 >> m >> s + 1;
for (int i = 2, j = 0; i <= n; ++ i)
{
while (j && p[i] != p[j + 1])
j = ne[j];
if (p[i] == p[j + 1]) j ++;
ne[i] = j;
}
for (int i = 1, j = 0; i <= m; ++ i)
{
while (j && s[i] != p[j + 1])
j = ne[j];
if (s[i] == p[j + 1]) j ++;
if(j == n)
{
cout << i - n << ' ';//注意,题目中下标从0开始,本来是i-n+1,所以-1后是这样
j = ne[j];
}
}
return 0;//养成好习惯
}
五、结尾
初一开始学的,现在初二,虽然学了很多,但是发现基础不是那么好,回来巩固,发现好多不会(笑),就这kmp都让我头疼,希望大家在未来能越走越远,越来越好-……
(先写到这吧,我得先去写作业去了,!-!)