不想贴网页这道题搞得我筋疲力尽。
虽然是道kmp模板题但对于我这种渣渣真的读了好久代码。
首先,我们发现因为有重叠的情况,暴力会一次又一次地寻找与开头毫不相关的字符,于是kmp就来了。。。它是用来跳过已判断的合法区间的。
先举个栗子:
abccccjhabcbb
可以发现,串中有2组abc可作为开头。(与大字符串匹配时要用整条小字符串,可这也意味着大字符串中必包含2个abc,都可作为小串的开头)
因此,我们定义nex数组来表示i号位之前与开头串匹配的串的长度。至于为什么是while循环?为了找到与i号位相匹配的前面位置,因为i号位只有一次机会访问,故不能漏解。
再来个数据理解一下:
abcxabcyWSEBWabcxabcx
首先,第一个y的nex为第一个x,那遍历到第一个y和第三个x时,j就会跳回第一个x,通过之前的性质我们可以判断这是一定合法的。
接下来就好好研读代码吧!(嘿嘿嘿 )
#include<cstdio>
#include<iostream>
using namespace std;
string a, b;
int len, nex[1000002];
int kmp() {
int cnt = 0;
len = b.length();
for(int i = 1, j = 0; b[i]; i ++) {
while(j && b[i] != b[j])
j = nex[j];
nex[i + 1] = (b[i] == b[j]) ? ++ j : 0;
}
for(int i = 0, j = 0; a[i]; i ++) {
while(j && b[j] != a[i])
j = nex[j];
if(b[j] == a[i] && ++ j == len) {
cnt ++;
j = nex[j];
}
}
return cnt;
}
int main() {
cin >> a >> b;
printf("%d\n", kmp());
return 0;
}
最后的话:
为什么第2个for循环中匹配成功了不会为j = 0?
我们再来一组数据理解一下。
abababa
来来来,其实呢,一个串的最后一个可能是另一个串的第一个。
好了我要离开这个世界了大家不要缅怀我 ,如有问题,请大佬在评论区指出,siesie!