本文转载自字符串匹配KMP算法的讲解C++ - lijingran - 博客园
建议结合b站的一系列教学视频先去理解,再来看代码
以下是完整的代码
#include <iostream> // std::cout
#include <string> // std::string, std::stoi
#include <cstring>
#include <stdio.h>
#include <tgmath.h>
using namespace std;
void cal_next(char *str, int *next, int len);
int KMP(char *str, int slen, char *ptr, int plen);
int main ()
{
char *str = "bacbababadababacambabacaddababacasdsd";
int len_s = static_cast<int>(strlen(str)); //强制类型转换
char *ptr = "ababaca";
int len_p = static_cast<int>(strlen(ptr));
// int *next = (int*)malloc(len_p * sizeof(int)); // next队列就是ptr的最长前缀组成的数组
// cal_next(ptr, next, len_p); // 这一步只是为了演示next数列是怎么求的,以及结果如何
int a = KMP(str, len_s, ptr, len_p);
return 0;
}
void cal_next(char *str, int *next, int len)
{
next[0] = -1;//next[0]初始化为-1,-1表示不存在相同的最大前缀和最大后缀。
int k = -1;//k初始化为-1,k就是要找的最大公共前缀,k一直在前几个数之间徘徊
for (int q = 1; q <= len-1; q++)
{
// 上一把分析的是q-1位和k位,这一把就要分析q位和k+1位
while (k > -1 && str[k + 1] != str[q])//如果下一个不同,那么k就变成next[k],注意next[k]是小于k的,无论k取任何值。
{
k = next[k];//往前回溯,让k慢慢减小
//当然,使用k--也完全没问题,只是速度慢。
}
if (str[k + 1] == str[q])//如果相同,k++
{
k = k + 1;
}
next[q] = k;//这个是把算的k的值(就是相同的最大前缀和最大后缀长)赋给next[q]
}
}
int KMP(char *str, int slen, char *ptr, int plen)
{
int *next = new int[plen];
cal_next(ptr, next, plen);//计算next数组
int k = -1;
for (int i = 0; i < slen; i++)
{
while (k > -1 && ptr[k + 1] != str[i])//ptr和str不匹配,且k>-1(表示ptr和str有部分匹配)
k = next[k];//往前回溯
if (ptr[k + 1] == str[i])
k = k + 1;
if (k == plen-1)//说明k移动到ptr的最末端
{
cout << "String matching position is " << i-plen+1 << endl;
k = -1;//重新初始化,寻找下一个
i = i - plen + 1;//i定位到该位置,外层for循环i++可以继续找下一个(这里默认存在两个匹配字符串可以部分重叠),感谢评论中同学指出错误。并在该位置k设定为-1
// return i-plen+1;//返回相应的位置
}
}
return -1;
}
得到的运行结果为:
String matching position is 10
String matching position is 26