KMP算法是一个快速的字符串匹配算法,比如要在字符串s中判断是否存在字符串t,最最简单的算法就是暴力的搜一遍,但是暴力的复杂度太高,最坏达到了O(n*m)(n是s的长度,m是t的长度)的复杂度,在n m都较大的情况下暴力算法很耗时间。而kmp算法可以大大优化复杂度,可以达到O(n+m)的复杂度。
KMP算法的核心是求出next数组,next数组就是在进行匹配某一位置的字符时如果匹配失败的话所进行的跳转,即除去无用功。
例如:串t : aaabbaac
他的next数组就是
s:……a a a b b a a f…….
t串:: a a a b b a a c
next : 0 1 2 0 0 1 2 0
下标:1 2 3 4 5 6 7 8
假设已经t字符串已经匹配到下标8的位置了并且匹配失败了,那就不用让字符s从aabbaaf继续匹配了,而是直接跳到aaf并且t跳到开头abbaac处,然后继续匹配,少做了很多无用功,即:
......a a a b b a a f.......
a a a b b a a c
然后继续匹配,大大提高了效率,而这个next数组其实就是对于next[i]从下标1到下标i的这段子串中,最长相同前后缀的长度。
比如对于a a a b b a a c
next[1] = 0 起始位置永远是0
a a========next[2] = 1 最长相同前后缀:a
a a a=======next[3] = 2 最长相同前后缀:a a
a a a b======next[4] = 0 最长相同前后缀:无
a a a b b=====next[5] = 0 最长相同前后缀:无
a a a b b a====next[6] = 1最长相同前后缀:a
a a a b b a a ==next[7] = 2 最长相同前后缀:a a
a a a b b a a c==next[8] = 0 最长相同前后缀:无
代码:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn = 10000 + 7;
void getFail(char *p, int *f) { // 获得next数组,f就是next数组
int len = strlen(p);
f[0] = f[1] = 0;
for (int i = 1; i < len; ++i) {
int j = f[i];
while (j && p[i] != p[j]) j = f[j]; //精髓所在,具体就是对于某一位i,看他前一位的next里面的数,如果p[next[i-1]]跟p[i]一样,则next[i] = next[i-1] + 1,否则等于0
f[i + 1] = p[i] == p[j] ? j + 1 : 0;
}
}
int f[maxn];
int kmp(char *s, char *t) { // s是主串,t是要寻找的串
memset(f, 0, sizeof(f));
int n = strlen(s), m = strlen(t);
getFail(t, f);
int j = 0;
for (int i = 0; i < n; ++i) {
while (j && s[i] != t[j]) j = f[j];
if (s[i] == t[j]) ++j;
if (j == m) return i - m + 1;
}
return -1;
}
char s[maxn], t[maxn];
int main() {
scanf("%s%s", s, t);
int ans = kmp(s, t);
for (int i = 0; i <= strlen(t); ++i) printf("%d ", f[i]);
printf("\n");
printf("%d\n", ans);
return 0;
}