对应字符串来说,用暴力算法来匹配字符串是一个很痛苦的一件事情,但是有三位大佬发明了kmp算法,这件事情就变得简单多了:
首先,要实现kmp算法就必须得有前缀表,前缀表就是包括第一个字符的所有子串值相等子串的最长长度,比如我们有一个字符串ABABAB它可以分为A AB ABA ABAB ABABA ABABAB
那么他们的前缀表是0, 0, 1, 2, 1, 2。为了方便计算,我们可以把前缀表整体后移(第一个变成-1),这样前缀表求变成了-1, 0, 0, 1, 2, 1。
所以具体代码如下:
#include <stdio.h>
#include <string.h>
#include <malloc.h>
// 获取前缀表
void prefix_table(char pattern[], int prefix[], int n) {
prefix[0] = 0; // 第一个前缀表肯定等于0
int len = 0;
int i = 1; // 从第二个字符开始遍历
while (i < n) {
// 如果相等,第i个前缀表就等于len++
if (pattern[i] == pattern[len]) {
len++;
prefix[i] = len;
i++;
} else {
// 否则的话,len就等于len减一的前缀表
if (len > 0) len = prefix[len - 1];
// 如果len是0或的话,prefix[i]肯定也是0
else {prefix[i] = len; i++;}
}
}
}
// 移动前缀表,第一个前缀表改为-1
void move_prefix_table(int prefix[], int n) {
int i;
for (i = n - 1; i > 0; i++)
prefix[i] = prefix[i - 1];
prefix[0] = -1;
}
void kmp_search(char text[], char pattern[]) {
int n = strlen(pattern); // n等于子串的长度
int m = strlen(text); // m等于主串的长度
int *prefix = malloc(sizeof(int) * n); // 前缀表
prefix_table(pattern, prefix, n); // 求出前缀表
move_prefix_table(prefix, n); // 移动前缀表
int i = 0; // i指向主串
int j = 0; // j指向子串
while (i < m) {
// 如果匹配成功,输出,并继续匹配
if (j == n - 1 && text[i] == pattern[j]) {
printf("Found at %d\n", i - j);
j = prefix[j];
}
if (text[i] == pattern[j]) i++, j++; // 如果字符相等,遍历下一个
else {
j = prefix[j]; // 将j退回到prefix[j],并于i匹配
if (j == -1) i++, j++; // 如果前缀表是-1,则i和j统一向后移一位
}
}
}
int main() {
char pattern[] = "ABABCABAA"; // 定义并初始化子串
char text[] = "ABABABCABAABABAB"; // 定义并初始化主串
kmp_search(text, pattern); // 开始匹配
return 0; // 程序结束
}