老生常谈的算法了...记得也是前前后后看了好多次,但是不久后就又忘记next数组的含义。
这次我觉得终于能一句话看懂了,不需要我再像以前看图解一样把自己绕晕:
2022.3补充理解:
结合应用场景来理解,如果T作为子串,去匹配另一个字符串S,中途的下一个字符没匹配上,那么T应该找到具有相同前缀(指从头开始看)的最近位置,这个最近位置的下一个字符应该要匹配上,否则继续找当前的最近位置,直到找到0状态,也就是下一次T要从头开始去对应S了。
我们其实是看当前状态的下一个字符是否匹配得上,也就是当前状态是要比当前匹配的字符慢一个的,有点未卜先知的感觉,从而我知道没匹配上,我得去找前面的最近位置。结合有限状态机来理解更容易:有限状态机之 KMP 字符匹配算法 :: labuladong的算法小抄
模板(带我自己写的注释):
void getnext() {
next[1] = 0; //这里默认字符串都从下标1开始,这是因为,0状态表示要从头开始
for(int i = 2; i <= n; i++) { //i从2开始。
int j = next[i - 1];
while(t[j + 1] != t[i] && j > 0) {
j = next[j];
}
if(t[j + 1] == t[i]) {
next[i] = j + 1;
} else {
next[i] = 0;
}
}
}
int kmp() {
int j = 0;
for(int i = 1; i <= m; i++){
while(t[j + 1] != s[i] && j > 0) { //如果不匹配则一直去赋为next[j]直到匹配或无法匹配
j = next[j];
}
if(t[j + 1] == s[i]) {
j++;
}
if(j >= n-1) { // 注意这里得是n-1,表示子串的最后一个下标已匹配成功
return i - n + 1; //第一个匹配的起点
}
}
return 0;
}