一、KMP介绍:
KMP算法由Knuth、Morris和Pratt 提出的字符串匹配的算法;
MKP算法的核心则是前缀表的构建,关于前缀表如何去计算?很多资料在构建前缀表的描述中很是简略,对于初学者很难搞懂前缀表到底是怎么计算出来的。
为什么在KMP字符串匹配算法中要使用前缀表?
前缀表的作用就是记录当前元素及之前元素构成的子串中的最长相同前后缀的长度。
字符串匹配暴力解法中需要将匹配串(长度为m)与主串(长度为n)进行每一个元素的比较。比如匹配串第一个元素和主串第一个元素比较,如果一样,同时后移一位进行比较;如果不一样,将主串开始匹配位置后移一位,即将匹配串第一个元素与主串的第二个元素进行比较…以此类推。这种暴力解法的时间复杂度为O(m*n)。
而使用前缀表,但第i个元素不匹配时,匹配串就可以根据前缀表查到当前元素对应的跳转的位置,而不是回到开头再重新去匹配一遍。
在说前缀表的构建之前,先说明一下前缀和后缀的定义。
前缀:去除字符串中最后一个元素的其余连续子串;
后缀:去除字符串中第一个元素的其余连续子串;
这时得到的前缀表就是原始的前缀表。
KMP特殊情况:
当第i个元素不匹配时,这个元素对应的前缀表值为i,所以会陷入死循环。
解决办法:
1、在构建前缀表时将前缀表值统一-1,使用时都恢复+1。(变值)
2、或者在使用的时候将索引序号前移-1,使用时使用前移的索引号。(变索引)
二、C++代码
/* 字符串匹配算法:kmp算法
*/
#include<iostream>
#include<string>
using namespace std;
void getNext(int* next,string &s){
int j = -1;
next[0] = j;
for(int i = 1;i < s.size();i++){
while(j >= 0 && s[i] != s[j+1]){
j = next[j];
}
if(s[i] == s[j+1]){
j++;
}
next[i] = j;
}
}
bool kmp(string &mainString,string &sonString){
if(sonString.size() == 0){
cout << "搜索字符串为空";
return false;
}
int next[sonString.size()];
int j = -1;
getNext(next,sonString);
for(int i = 0;i < mainString.size();i++){
while(j >= 0 && sonString[j+1] != mainString[i]){
j = next[j];
}
if(sonString[j+1] == mainString[i]){
j++;
}
if(j == sonString.size()-1){
cout << "字符串匹配找到";
return true;
}
}
cout << "字符串匹配未找到";
return false;
}
int main(){
string txt = "abaab aaababaab aabbabb";
string str = "aababa";
kmp(txt,str);
/*
int next[str.size()];
getNext(next,str);
for(int i = 0;i < str.size();i++){
cout << next[i] << "、";
}
cout << endl;
*/
return 0;
}
三、运行结果
1、示例一
2、示例二
描述错误地方,请指正。