前言: 菜鸟一枚,最近学习了Kmp算法,其中有很多的不懂,在这里总结一下前两天学习的结果,写出来最简单的C语言代码实现算法,其中有不少借鉴到别处,如有侵权,请联系我,我定反思并道歉。
好了,言归正传,在这两天学习kmp算法的过程中,最让我感到头痛的就是构造next数组了,我觉得只要构造好了该数组,就算是成功了一半。在计算next值得时候,最重要的是理解最大前缀后缀,在计算出最大长度值后再计算next会轻松很多,当然很多的说法我觉得都是殊途同归,最终都是为了next表。
下面根据具体代码和注释来解释:
/*next数组*/
void GetNext(sq q, int next[])
{
int i = 0,j = -1;
next[0] = -1; //next数组默认首值为-1
while (i < q.length)
{
/*自匹配过程*/
if (j == -1 || q.string[i] == q.string[j]) //如果是首字符或者两个字符相等,继续下一个字符比较
{
i++;
j++;
next[i] = j;
}
else
j = next[j]; //找相对较小的最大前后缀
}
for (i = 0; i < q.length; i++)
{
printf("%2d", next[i]);
}
}
next数组的实现代码就如同上述,具体的原理比较复杂,我不太解释的清楚,推荐大家搜索CSDN上面的大佬博客,有很多都讲的比较清楚(前辈可敬啊)。
接下来,利用上面的next数组进行Kmp字符串的匹配:
/*Kmp算法*/
int Kmp(sq s,sq p,int next[])
{
int c = 0; //主串移动变量
int d = 0; //模式串移动变量
while (c < s.length && d < p.length) //合法长度之内
{
if(d == -1||s.string[c]==p.string[d]) //d== -1代表是模式串首字符
{
/*d==-1或者匹配成功就累加继续比较下一个*/
c++;
d++;
}
else
d = next[d]; //利用Next数组进行移动,这里是移动较大的长度,避免了不必要的回溯
}
if (d == p.length)
return c - p.length; //只要能匹配成功,最后d都会累加到模式串的长度
else
return -1; //没有匹配成功
}
我们可以看见,Kmp算法的核心就是next数组,这里就是根据已经计算好的next数组进行移动比较,避免了蛮力算法的一个一个回溯,减小了时间复杂度。
下面贴出完整程序:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#define N 100
/*串结构体*/
typedef struct Stirngs
{
char string[100];
int length;
}sq;
/*next数组*/
void GetNext(sq q, int next[])
{
int i = 0,j = -1;
next[0] = -1;
while (i < q.length)
{
if (j == -1 || q.string[i] == q.string[j])
{
i++;
j++;
next[i] = j;
}
else
j = next[j];
}
for (i = 0; i < q.length; i++)
{
printf("%2d", next[i]);
}
}
/*Kmp算法*/
int Kmp(sq s,sq p,int next[])
{
int c = 0;
int d = 0;
while (c < s.length && d < p.length) //合法长度之内
{
if(d == -1||s.string[c]==p.string[d]) //d== -1代表是首字符;
{
c++;
d++;
}
else
d = next[d]; //利用Next数组进行移动
}
if (d == p.length)
return c - p.length;
else
return -1;
}
/*主函数*/
int main(void)
{
int next[N];
int a;
sq s ;
sq p ;
printf("Please Input S string: \n");
scanf("%s", s.string);
printf("Please Input P string: \n");
scanf("%s", p.string);
s.length = strlen(s.string);
p.length = strlen(p.string);
GetNext(p,next);
printf("\n");
if (Kmp(s, p, next)!= -1)
{
printf("kmp匹配成功!");
for (a = Kmp(s, p, next); a < Kmp(s, p, next) + p.length; a++)
{
printf("%c", s.string[a]);
}
}
else
printf("匹配失败!");
printf("\n");
system("pause");
return 0;
}
运行的结果:
到这里,我目前所学的Kmp算法就是这样,欢迎大家之处我的错误,因为是小白,所以可能很多低级错误,恳请大家不要见笑,多多包涵。