KMP算法的核心就是next数组如何去求
求next数组的代码如下
int GetNext(char ch[],int cLen,int next[]){//cLen为串ch的长度
next[1] = 0;
int i = 1,j = 0;
while(i<=cLen){
if(j==0||ch[i]==ch[j]) next[++i] = ++j;
else j = next[j];
}
}
————————————————
版权声明:本文为CSDN博主「Sirm23333」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_37969433/article/details/82947411
next数组是什么呢
就是记录该元素前有多少个元素和首段的元素相同
next数组的意思就是 next[i] = len; 长度为i的数组的前缀和后缀相等的最大长度-1。 例如abcdabc就是 next[7] = 3; 相等的前缀和后缀最长是ab长度为3-1.
如何求next呢
假如我们想求下标为i的next的值
我们则需要看看next[- -i]的值是多少,假设next[- -i]=5;
则说明- -i前面有4(5-1)个首尾重复的。
然后我们只需要对比重复末尾的后一个(下标也就是为5和- -i)的是否相同,相同的话则i的next值就是6(5+1)。
不相同则从红色字体那里开始重复,并且看next[5](也就是开端重复的末尾)的值是多少。
在next的code中值得注意的是,这个j有着两个含义,第一是代表着j是next对应下标的值,第二就是代表开端重复的后一个位置。
这为什么j=next[j]
。
为什么要求next呢
next的作用就是在遇到那个不匹配的字符,可以直接判断出,不匹配字符前有多少个和开端是重复的,然后重复的那部分就可以不用进行匹配了。
然后直接从(副串)重复部分的后一个字符那里开始比较,这样就比较快。
并且主串不用回流,只用一直加加加。
KMP主函数代码
void Getnext(int next[],String t)
{
int j=0,k=0;
next[0]=0;
while(j<t.length-1)
{
if(k == 0 || t[j] == t[k])
{
j++;k++;
next[j] = k;
}
else k = next[k];
}
}
主函数和next有点像,它的k=next[k]也是相同含义,k值移动开端的第k个元素。
若匹配成功则j++和k++
注意当k退到0的时候,则就直接j++和k++,相当于重新匹配。
这里的j(也就是主串)的下标是一直在往后移,没有回溯。