目录
写在前面:
我将KMP算法分为了三个篇章:
【原理篇】:主要讲解KMP实现的原理,以及手动求NEXT数组。
【数理篇】:主要讲解如何在手动求出NEXT数组的情况下,找出数学规律,为之后的算法实现奠定基础。
->【实现篇】:主要讲解以C语言代码的方式实现KMP算法,以及NEXT数组的优化。
本篇章将结合前两章所讲内容,代入C代码进行实现吗。可点访问我的个人主页进行回顾,也可点击上方对应链接访问,那么我们开始了。
🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈
C代码实现:
初始化与基础情况处理:
int KMP(char *str,char*pat,int pos)
{
assert(str&&pat);
const int lenstr=strlen(str);
const int lenpat=strlen(pat);
int *next=NULL;
next=(int*)malloc(sizeof(int)*lenpat);
if(!lenstr||!lenpat)return -1;
if(pos<0||pos>=lenstr)return -1;
定义一个函数,传入参数为两个字符串,以及一个pos(表示从主串str的哪个位置开始搜寻子串pat)
若传入参数为空则assert报警
。将主串与模板串的长度存入变量,防止以后每次想要获取长度时都调用函数,节省时间。
创建NEXT数组分配长度为LENPAT的空间大小。若主串||模板串大小为0||pos<0||pos>=主串长度,则函数结束。
NEXT数组实现:
PAT[i]=PAT[k]
在PAT[i]=PAT[k]的情况下,NEXT[i+1]=k+1。因为NEXT数组0号位与1号位是规定好的-1与0的值,所以我们初始化时直接将他们填入即可,此时我们的i从2号位开始而我们的k从0号位开始,此时的情况如下方所示。
k | 实际的i | i(要求的) | |||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
PAT字符串 | a | b | a | a | b | a | b | c | a | b | c |
NEXT数组 | -1 | 0 |
套用我们的公式,可以很轻松的得出NEXT[2]=1(k+1)。但是,在代码当中这个i所对应的NEXT数组,也就是NEXT[i]是未知的,而我们之前所有的推论都基于NEXT[i]=k,也就是NEXT已知的情况下,所以公式里的i实际上是这里的i-1。所以真正的(代码)公式是NEXT[i+1]=k+1
k | 实际的i | i+1 | |||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
PAT字符串 | a | b | a | a | b | a | b | c | a | b | c |
NEXT数组 | -1 | 0 |
所以这时的NEXT[i+1]=-1+1=0;
PAT[i]!=PAT[k]
综上这里写的i也是代表我们要求的i,所以我们现在实际要判断的是i-1的位置上PAT[i-1]!=PAT[k],此时k=NEXT[k]进行一个回滚的操作。
NEXT数组代码实现:
void GetNext(char*pat,int * next,int lenpat)
{
next[0]=-1;
next[1]=0;
int i=2;//当前i下标
int k=0;//next数组里的数
for(;i<lenpat;)
{
// p[i]==p[k] next[i+1]=k+1
if(k==-1||pat[i-1]==pat[k])
{
next[i]=k+1;
i++;
k++;
}
else {
k=next[k];
}
}
}
首先进行初始化。之后进入一个循环,若满足k==-1(边界的设置)||pat[i-1]==pat[k]则说明匹配成功,两个下标加一,进入到下一个匹配,反之k=NEXT[k]进行一个回滚的操作。
至此NEXT数组函数完结。
KMP函数:
int KMP(char *str,char*pat,int pos)
{
assert(str&&pat);
const int lenstr=strlen(str);
const int lenpat=strlen(pat);
int *next=NULL;
next=(int*)malloc(sizeof(int)*lenpat);
if(!lenstr||!lenpat)return -1;
if(pos<0||pos>=lenstr)return -1;
GetNext(pat,next,lenpat);
int i=pos;
int j=0;
while(i<lenstr&&j<lenpat)
{
if(j==-1||str[i]==pat[j]){
i++;
j++;
}
else {
j=next[j];
}
}
if(j>=lenpat)return i-j;
return -1;
}
求出NEXT数组后,返回到KMP函数当中,进入主串与模板串的匹配。循环条件为两个指针小于各自数组的长度。当j==-1||str[i]==pat[j],表示匹配上了,此时指针前移,其余部分与NEXT数组实现大同小异,这里就不过多赘述。
之后返回i-j表示从主串当中哪里开始匹配上的。否则返回-1.
KMP算法代码部分:
#include<stdio.h>
#include<string.h>
#include<assert.h>
#include<malloc.h>
// str为主串 pat为子串 pos为寻找的起始位置
void GetNext(char*pat,int * next,int lenpat)
{
next[0]=-1;
next[1]=0;
int i=2;//当前i下标
int k=0;//next数组里的数
for(;i<lenpat;)
{
// p[i]==p[k] next[i+1]=k+1
if(k==-1||pat[i-1]==pat[k])
{
next[i]=k+1;
i++;
k++;
}
else {
k=next[k];
}
}
}
int KMP(char *str,char*pat,int pos)
{
assert(str&&pat);
const int lenstr=strlen(str);
const int lenpat=strlen(pat);
int *next=NULL;
next=(int*)malloc(sizeof(int)*lenpat);
if(!lenstr||!lenpat)return -1;
if(pos<0||pos>=lenstr)return -1;
GetNext(pat,next,lenpat);
int i=pos;
int j=0;
while(i<lenstr&&j<lenpat)
{
if(j==-1||str[i]==pat[j]){
i++;
j++;
}
else {
j=next[j];
}
}
if(j>=lenpat)return i-j;
return -1;
}
int main()
{
printf("%d\n",KMP((char*)"ababcabcdabcde", (char*)"abcd",0));
}
// 有一种植物有一种动物像鸡 请问是什么植物和动物
完结撒花:
留有一个彩蛋看上方最后一行的注释(doge
附上Gitee链接,若想要完整代码可以自取KMP算法实现。
至此,本篇博客的内容九分钟带你弄懂KMP算法【实现篇】告一段落,KMP相关的所有内容也已更新完毕,可访问我的主页进行查看,接下来我会更新LeetCode上KMP相关的算法题。
若对你有些许帮助,可以点赞、关注、评论支持下博主,你的支持将是我前进路上最大的动力。
若以上内容有任何问题,欢迎在评论区指出。若对以上内容有任何不解,都可私信评论询问。
诸君,山顶见!
🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈