KMP算法是对BF暴力做法的优化,平均时间复杂度可以到O(n+m)
KMP 的算法思想设计思想:
利用已经部分匹配的结果而加快模式串的滑动速度
主串S的指针不回溯
模式串指针J回溯的情况:在已匹配的部分串中找信息,加快匹配
#说明
这里算出的next数组是整体加一后的
也有的地方是不加1的,思想都一样
具体区别就是next[1]=0 (整体加1) 还是 next[1]=-1 (没加1)
前提知识补充:
主串S 指针i 和 模式串T 指针j
举例:最大前后缀长度
‘abab’ 的前缀{a,ab,aba} 后缀{b,ab,bab}, 那么最长相等前后缀长度为 2
next 数组的计算方法及举例
①当模式串指针j 前面的子串最大前后缀长度大于1时,用max求 ,当模式串的指针 j 指到某一位置,j 指针之前的字符串的前后缀长度取 最大 max{前后缀1,前后缀2…},
②注意max公式给出的下标前k-1个元素 如果k-1个元素 最大前后缀长度为1 则 K=2
③next[1]=0 :即当模式串中的第一个字符与主串当前字符不相等时,next[j]=0,表示模式串应右移一位,主串当前指针右移一位,再和模式串的第一个字符进行比较
解释说明next[j]:
j=1 : 由公式得 next[1] =0
j=2 : 当 j!=1 并且 j 指针前面前后缀长度为0 属于其他情况 next[2]=1
j=3 : 当 j!=1 并且 j 指针前面前后缀长度为0 属于其他情况 next[3]=1
j=4 : 当 j!=1 并且 j 指针前面前后缀长度为0 属于其他情况 next[4]=1
j=5 : j 前面的字符串 ‘abca’ 明显有一个最长前后缀为1 则按公式 K=2 next[5]=2
j=6 : j 前面的字符串 ‘abcaa’ 也只有一个最长前后缀为a,长度为1 则按公式 K=2 ,next[6]=2
...
j=11 : 当j=11时,j指针前面的字符串为 ‘abcaabbcab’ 最长前后缀为 ab 按公式 K=3 ,next[11]=3
#以此类推
...
# 求模式串next 数组
typedef struct {
char ch[MAXLEN];
int length;
}SString;
void get_next(SString T,int next[]){ #可以带入上面的例子具体模拟一遍
int i=1,j=0; //数组的下标从一开始
next[1]=0;
while(i<T.length){
if(j==0||T.ch[i]==T.ch[j]) //计算 i+1 以指针i结束的字符串的最长前后缀 然后 i++得到next[i]
{
++i;++j;
next[i]=j; // 这个j++ 相当于前面求K 长度加一
}
else{
j=next[j]; //否则令 j=next[j] 回溯指针寻找最大的前后缀长度 循环继续
}
}
}
# KMP 算法
int Index_KMP(SString S,SString T,int next[]){
int i=1,j=1;
while(i<=S.length&& j<=T.length){
if(j==0||S.ch[i]==T.ch[i]){
++i,++j; //继续比较后继字符
}else
j=next[j]; //模式串向右移动
}
if(j>T.length)
return i-T.length;
else
return 0;
}
补充知识:求next的优化的数组nextval
这个可以自行按题解模拟