在计算机科学中,Knuth-Morris-Pratt字符串查找算法(简称为KMP算法)可在一个主文本字符串S内查找一个词W的出现位置。此算法通过运用对这个词在不匹配时本身就包含足够的信息来确定下一个匹配将在哪里开始的发现,从而避免重新检查先前匹配的字符。
第一步求出字符串前缀表的值
#include <stdio.h>
/*
prefix_table这个函数,给定一个字符串patten,和其长度n
求出 prefix[]: patten所有前缀,前面后面相同的长度
*/
void prefix_table(char patten[], int prefix[], int n){
prefix[0] = 0;//第一个字符的相同的长度肯定是0
int len = 0;//len的意思为前一个字符的prefix
int i = 1;//从第一个开始计算
while (i < n){
if (patten[i] == patten[len]){
len++;
prefix[i] = len;
i++;
}
else{
if (len > 0){//如果不设置这个条件当patten[0] != patten[i],数组会越界
len = prefix[len - 1];
}
else{//如果len == 0, 并且patten[0] != patten[i],那么直接给prefix[i]赋0即可
prefix[i] = len;
i++;
}
}
}
}
int main(){
char patten[] = "ABABCABAA";
int prefix[9];
prefix_table(patten, prefix, 9);
int i = 0;
for (i = 0; i < 9; i++){
printf("%d\n", prefix[i]);
}
return 0;
}
第二步将前缀表往后错一位,prefix[0]赋值为0
增加函数
void move_prefix_table(int prefix[], int n){//往后错一位,目的是让前缀表对应前一个字符的值
for (int i = n - 1; i > 0; i--){
prefix[i] = prefix[i - 1];
}
prefix[0] = -1;
}
第三步,加入查找程序
void search_patten(char patten[], char test[], int prefix[]){
int n = strlen(patten);
int m = strlen(test);
int i = 0, j = 0;
// int* prefix = malloc(sizeof(int) * n);
prefix_table(patten , prefix, n);
move_prefix_table(prefix, n);
//test[i], len[test] = m;
//patten[j], len[patten] = n;
while(i < m){
if (j == n - 1 && test[i] == patten[j]){
printf("Found patten at %d\n", i - j);
j = prefix[j];
}
if (test[i] == patten[j]){
i++;
j++;
}
else{
j = prefix[j];
if (j == -1){
i++;
j++;
}
}
}
}
总程序
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
/*
prefix_table这个函数,给定一个字符串patten,和其长度n
求出 prefix[]: patten所有前缀,前面后面相同的长度
*/
void prefix_table(char patten[], int prefix[], int n){
prefix[0] = 0;//第一个字符的相同的长度肯定是0
int len = 0;//len的意思为前一个字符的prefix
int i = 1;//从第一个开始计算
while (i < n){
if (patten[i] == patten[len]){
len++;
prefix[i] = len;
i++;
}
else{
if (len > 0){//如果不设置这个条件当patten[0] != patten[i],数组会越界
len = prefix[len - 1];
}
else{//如果len == 0, 并且patten[0] != patten[i],那么直接给prefix[i]赋0即可
prefix[i] = len;
i++;
}
}
}
}
void move_prefix_table(int prefix[], int n){//往后错一位,目的是让前缀表对应前一个字符的值
for (int i = n - 1; i > 0; i--){
prefix[i] = prefix[i - 1];
}
prefix[0] = -1;
}
void search_patten(char patten[], char test[], int prefix[]){
int n = strlen(patten);
int m = strlen(test);
int i = 0, j = 0;
// int* prefix = malloc(sizeof(int) * n);
prefix_table(patten , prefix, n);
move_prefix_table(prefix, n);
//test[i], len[test] = m;
//patten[j], len[patten] = n;
while(i < m){
if (j == n - 1 && test[i] == patten[j]){
printf("Found patten at %d\n", i - j);
j = prefix[j];
}
if (test[i] == patten[j]){
i++;
j++;
}
else{
j = prefix[j];
if (j == -1){
i++;
j++;
}
}
}
}
int main(){
char patten[] = "ABABCABAA";
char test[] = "AAABABCABAAJKKAJKASDASADA";
int prefix[9] = {0};
search_patten(patten, test, prefix);
// int prefix[9];
// prefix_table(patten, prefix, 9);
// move_prefix_table(prefix, 9);
// int i = 0;
// for (i = 0; i < 9; i++){
// printf("%d\n", prefix[i]);
// }
return 0;
}