Kmp算法是一种效率极高的串匹配算法,适用这样的场景,在给定文本串text中查找是否含有指定的模式串pattern。
效率高的原因:利用部分匹配的信息,将已经匹配到信息存入next数组。本质上我觉得还是空间换时间的思想。类似的有求最大回文串长度的manacher算法。
时间复杂度O(n+m)
最长公共前后缀
next数组的求解 next数组可以称之为prefix table,前缀表。
next[i]表示的最长公共前后缀中前缀的最后一位下标(在数组中的位置)。
对于任意字串s[0…i] 长度为k+1的前缀为s[0…k] 后缀为s[i-k…i]
next[i]表示使得子串s[0…i]的前缀s[0…k]和后缀s[i-k…i]相等的最大的k,其中前缀和后缀可以部分重叠,但是不也能是s[0…i]本身。
const int MAX=10010;
int Next[MAX];
void getNext(char s[], int n) {
int j = -1;
/* Next数组的起始索引,是一个无效的索引
表示最长公共前后缀前缀的最后一位的下标
*/
Next[0] = -1;
for (int i=1; i<n; ++i) {
while (j != -1 && s[i]!=s[j+1]) j = Next[j];
if (s[i] == s[j+1]) j ++;
Next[i] = j;
}
}
bool kmp(char *text, char *pattern) {
int n = strlen(text), m = strlen(pattern);
getNext(pattern, m);
int j = -1;
for (int i=0; i<n; ++i) {
while (j != -1 && text[i] != pattern[j+1]) j = Next[j];
if (text[i] == pattern[j+1]) j ++;
if (j == m-1) return true;
}
return false;
}