原因:
近日来,看视频也未看懂KMP算法到底是个啥子鬼哦。最终看书看懂了一点,并敲出了代码,书上是C++,而我还在用C,所以与书上代码是有所区别的。
其实,大体上还是十分模糊的。想在这里理一下思路。
KMP算法的原理什么的,就自己去百度一下就好了。
其实,KMP最重要的是对next数组推导。next数组的特别之处,就在于它其实是根据T字符串的各个值而得到的。得到next数组的规律, 我认为是这样的:
在T字符串中的i个位置上的next值。是根据前面0——i-1个字符推导出来的。如果第0个字符到第j(j<i)个字符与第k(j<k<i)个字符到第i-1个字符处相等,则i位置上的next值就是j。即如果第i个位置上的字符前面的字符串中。如果出现了开头一串和结尾一串字符相等,那么第i个字符的next值就是开头一串相等字符串的最后一个字符的值。
如果没有这样的相等字符串,则为next值为-1。
#include"stdio.h"
#include"string.h"
//得到next数组,本代码与书上有所差别。
void get_next(char *T,int next[])
{
int i=0;
int j=-1,lenT;
lenT=strlen(T);
next[0]=-1;
while(i<lenT)
{
if(j==-1||T[i]==T[j])
{
i++;
j++;
//这里是进一步优化next数组。
//表如果当前字符与前缀字符相同,那么next就是其前缀字符的next值。
if(T[i]==T[j])
next[i]=next[j];
else
next[i]=j;
}
else
j=next[j];
}
}
int Index_KMP(char *S,char *T,int next[])
{
int lenT,lenS,i,j;
lenT=strlen(T);
lenS=strlen(S);
i=-1;
j=-1;
while(i<lenS&&j<lenT)
{
if(j==-1||S[i]==T[j])
{
i++;
j++;
}
else
j=next[j];
}
//printf("j=%d i=%d\n",j,i);
//printf("lenT=%d lenS=%d\n",lenT,lenS);
//如果j到了T字符串的尾部,则找到了匹配的字符串。
if(j>=lenT)
return i-j;//返回匹配成功的字符串的下标位置。即i-j
//在这里将j看成T字符串的长度就好理解了。
return -1;
}
int main()
{
char S[255],T[255];
int next[255],pos,lenT,lenS;
while(~scanf("%s%s",S,T))
{
get_next(T,next);
lenT=strlen(T);
lenS=strlen(S);
pos=Index_KMP(S,T,next);
if(pos==-1)
printf("抱歉,主串中没有需要匹配的子串\n");
else
printf("子串在主串的%d位置上出现了\n",pos);
}
}