1、KMP算法的用途。
这里不阐述,自行百度。
2、next数组实现,即找出模式串的子串的前后缀的关系。
重点思路:通过已经求出的next数组的值,求后续的next数组的值。
整体思路:假设模式串长度为N,记为m[N],我们此时要求m[x]的next数组的值,即next[x]。
这里假设m[0]~~m[x-1]的next数组的值已经求出来了,
我们用m[next[x-1]-0]与m[x]比较,相等next[x]=next[x-1]-0+1,不相等则用m[next[x-1]-1]与m[x]比较,以此类推。
如果最后比到m[0]仍不相等,则m[x]=0;
以上只是知道这个求解思路,注意我们写代码最开始只找到next[0]=0,我们就是以next[0]=0这个已知的值,求后续的值的。
int * nextArr(char m[],int length){
int i,j;
static int next[N];
next[0]=0;
for(i=1,j=0;i<length;i++){ //i=1,j=0这里可以理解为要求next[1],我们根据已知的next[0]求
while(m[j]!=m[i]&&j>=0){
j--;
}
j++;
next[i]=j;
}
return next;
}
3、kMP整体实现
#include <stdio.h>
#include <string.h>
#define N 10
int* nextArr(char m[],int length);
int kmp(char m[],char t[],int next[],int mm,int tt);
int main(){
int i,mm,tt;
char m[]="abcabc";
char t[]="ababcabc";
int *pnext;;
mm=strlen(m);
tt=strlen(t);
pnext=nextArr(m,mm);
printf("next数组为:");
for(i=0;i<mm;i++){
printf("%d",*(pnext+i));
}
printf("\n");
i=kmp(m,t,pnext,mm,tt);
if(i==-1){
printf("在主串中无匹配!");
}else{
printf("在主串中匹配的首个序号是%d\n",i);
}
return 0;
}
/*
next数组,思路:
*/
int * nextArr(char m[],int length){
int i,j;
static int next[N]; //这里注意,定义为static 才能返回有效数组数据
next[0]=0;
for(i=1,j=0;i<length;i++){
while(m[j]!=m[i]&&j>=0){
j--;
}
j++;
next[i]=j;
}
return next;
}
/*
匹配串
*/
int kmp(char m[],char t[],int next[],int mm,int tt){
int i,j;
for(i=0,j=0;i<tt;){
if(m[j]==t[i]){
j++;
i++;
}else{
j=next[j];
}
if(j==mm-1){
break;
}
}
if(j==mm-1) return i-mm+1;
else return -1;
}