基本概念:
应用优化前提: 有部分匹配的前缀和后缀
KMP算法原理:
按普通的串的模式匹配算法,在1位置比较完之后,中间还有俩次比较才能到达位置2,KMP算法解决的就是如何找到直接找到位置2,继续进行比较的。
问: 为什么会找到位置2而不是其他位置?
答: 我们发现在模式串的子串(bacba)中存在相同的最长前缀(ba)和最长后缀(ba),那进行串的模式匹配时下一个匹配的位置就是后缀=前缀的位置,即将前缀移动到上一次比较的后缀的位置上在进行比较。
当移动到下一个比较位置时,主串的标志i不需要回退,继续向后比较即可
模式串的标志j就需要回退到相同前缀的下一个数据元素,回退的位数和部分匹配值相关,若用数组next[]存储部分匹配值,则有以下公式:
j-1表示上次已经匹配的子串的最后一个元素的位置,next[j-1]表示部分匹配值
问: 如何计算存储最长匹配值的数组next[]?
答:
前缀等于后缀的最长的串的长度
例:
考研当中上图的next[]数组并不是最终答案,为实现算法的便利性,考研中的next[]数组会由此数组经过若干次变化得到,变化过程如下:
问: 最终的nextp[]数组如何求得?
答:
1、右移操作,将move中的next[j-1] 变成 next[j]
2、加一操作将j = next[j] + 1变成 j = next[j] (有的教程不加1,具体与代码实现有关)
问: 如何更加高效的求解next[]数组?
答:
KMP算法的代码实现:
求next[]数组:
void get_next(String T,int next[]){
int i = 1,j = 0;
next[1] = 0;
while(i < T.length){
if(j == 0 || T.ch[i] == T.ch[j]){
++i;
++j;
next[i] = j;
}
else
j = next[j];
}
}
kmp算法:
int Index_KMP(String S,String T,int next[],int pos){
int i = pos,j = 1;
while(i <= S.length && j <= T.length){
if(j == 0 || S.ch[i] == T.ch[j]){
i ++;
j ++;
}
else
j = next[j];
}
if(j > T,length)
return i - T.length;
else
return 0;
}
KMP算法的性能:
时间复杂度: O(m + n)
空间复杂度: O(1)