KMP算法是一种用于在文本串种搜索一个词(也称为模式串)的高效算法,KMP算法的关键在于当发现不匹配时,它知道部分已经匹配的字符的信息,并利用这些信息来避免不必要的字符比较。
在KMP算法中,next数组扮演了重要的角色,next数组的主要目的是在发生不匹配时,告诉我们模式串应该从哪里开始重新进行匹配,
next数组的计算
next数组的定义如下:对于模式串p[0…m-1]中的每个位置i,next[i]表示在p[0…i-1】中最长相等前后缀的长度,下面给出next数组的伪代码
设模式串为 P[0...m-1],初始化 next[0] = -1
对于 i 从 1 到 m-1:
设 j = next[i-1]
当 j >= 0 且 P[j] ≠ P[i-1] 时,将 j 更新为 next[j]
如果 P[j] == P[i-1],则 next[i] = j + 1
否则,next[i] = 0
代码如下
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<stdlib.h>
#include<stdbool.h>
#define MaxSize 100
typedef struct {
char data[MaxSize];
int length;
}SqString;
void GetNext(SqString *q, int *next)
{
int k = -1, j = 0;//k=-1;
next[0] = -1;
while (j < q->length-1)
{
if (k == -1||q->data[j]==q->data[k])
{
k++;j++;
next[j] = k;
}
else
{
k = next[k];
}
}
}
bool KMP(SqString s, SqString t)
{
int next[MaxSize],i = 0, j = 0;
GetNext(&t, next);
while (i < s.length && j < t.length)
{
if (j == -1 || s.data[i] == t.data[j])
{
i++;
j++;
}
else
{
j = next[j];
}
}
if (j == t.length)
{
return true;
}
else
{
return false;
}
}
int main()
{
SqString s = {{"abaam,hjbcabaabctrd"},19};
SqString t = { {"abaabc"},5 };
printf("%d", KMP(s, t));
return 0;
}
运行结果如下