这个算法想了一天才理解,加上写代码改bug花费了很长时间呜呜呜。
KMP算法要比串的模式匹配算法时间复杂度要低,效率更高,时间复杂度为:O(n+m),n为主串长度,m为模式串长度。
实现代码:
#include<iostream>
using namespace std;
//求next数组,next数组记录最长公共前后缀的长度
void GetNext(string s, int* next) {
int i = -1, j = 0; //i表示前缀最后一个字符 j表示后缀最后一个字符
next[0] = -1; //特殊情况,下标为0的字符之前没有字符,所以最长公共前后缀长度记录特殊情况为-1,即模式串第一个字符不匹配时跳转到第一个字符前面的位置
//最后一个字符不需要加入求next数组的过程中
while (j < s.length() - 1) {
if (i == -1 || s[i] == s[j]) { //如果前后缀最后一个字符相等
i++;
j++;
next[j] = i; //下一个字符的最长公共前后缀长度为当前的i值即当前前缀的长度
}
else { //如果前后缀长度不相等
i = next[i]; //i跳转到与 除了最后一个字符的 后缀相等最长最长前缀的后一个位置处
//如果i跳转到-1说明前缀不存在与 除了最后一个字符的 后缀相等的字符,则下一个字符的最长公共前后缀长度为0
}
}
}
//kmp算法
int Kmp(string s1, string s2) {
int next[155];
GetNext(s2, next);
int n = s1.length(), m = s2.length();
int i = 0, j = 0;
while (i < n && j < m) {
//j=-1的情况为模式串的首位字符与主串当前要比较的字符不相等的特殊情况需要将模式串指针赋值为-1
if ( j == -1||s1[i] == s2[j]) { //如果相等则继续对比下一位
i++;
j++;
}
else {
j = next[j]; //回溯模式串指针
}
}
if (j == s2.length()) {
return i-j;
}
else {
return -1;
}
}
int main() {
string S1, S2,S3;
S1 = "abcdefg";
S2 = "cde";
S3 = "ac";
if (Kmp(S1, S2)!=-1)
cout << "S1中存在子串S2,起始下标为" << Kmp(S1, S2) << endl;
else
cout<< "S1中不存在子串S2" << endl;
if (Kmp(S1, S3)!=-1)
cout << "S1中存在子串S3,起始下标为" << Kmp(S1, S3) << endl;
else
cout << "S1中不存在子串S3" << endl;
return 0;
}