KMP算法的思路
KMP算法是由两个字符串组成,一个称之为模式串,另一个称之为文本串。就像平时我们在文章中搜索关键词一样,模式串就是我们输入的关键词,也就是我们需要查找的,而文本串就是我们阅读的文章,所以从事实出发,模式串是要远远短于文本串的。KMP算法相比与朴素算法,时间复杂度从O(nm)提升到了O(n+m)。
KMP算法相比与朴素算法,精髓就在于利用了已经匹配成功的数据,每次匹配失败后不至于从头匹配。
举例来理解:
模式串:abcab
文本串:abcacababcab
前四位匹配成功,第五位匹配失败,则将模式串移动到模式串中与失配字符相同的那一位。可以用前后缀来理解,也就是将前缀移动到相同的后缀处,根据相同的前后缀来实现快速移动。移动后如下:
模式串: abcab
文本串:abcacababcab
但有时前后缀不光只有一个字符相同,可能有多个字符。举例来理解:
模式串:abcabc
文本串:abcabdababcabc
此时前五位匹配成功,第六位匹配失败,可以观察到在匹配成功的文本串的后两位为ab,正好与模式串的前两位ab相同,那么根据前后缀移动:
模式串: abcabc
文本串:abcabdababcabc
那么此时KMP的核心就很明确了,当匹配失败时,我们要根据相同的前后缀来实现快速移动模式串。
Next数组
Next数组是用来记录匹配失败后应该跳转到哪个位置的数组,对于模式串的第一位和第二位而言,只能跳转到第一位,因为Next 是要将真前缀跳跃到与它相同的真后缀上去(通常也可以反着理解),所以当i=0 或者 i=1 时,相同的真前缀只会是 str1(0) 这一个字符,所以Next[0]=Next
[1]=0。通俗一点理解就是,你第一位或第二位都匹配不上,那你就只能从第一位从新开始匹配咯。
代码实现:
for (int i = 2, j = 0;i <= n;i++)
{
while (j && p[i] != p[j + 1]) {
//判断j是否为0是因为跳回到第一个字符后就不用回跳了
j = Next[j];
}
if (p[i] == p[j + 1]) {
j++;
Next[i] = j;
}//通过自己匹配自己来得出每一个点的next值
}
cout << "Next数组:";
for (int i = 1;i <= n;i++) {
cout << Next[i] << ' ';
}
KMP匹配过程(完整代码在这里,大佬直接点这里就行)
有了Next数组之后,KMP的代码就很好写了,由此可得,Next数组才是KMP算法的精髓所在
完整代码如下:
#include <iostream>
#include <string>
using namespace std;
const int N = 100000;
char p[N], s[N];
//next数组表示的是不匹配时子串下标退回的位置
//比如next[i]=j就表示在子串中p[1~j]=p[i-j+1~i]
//所以子串直接退回到j下标继续和主串进行模式匹配直到匹配成功为止
int Next[N] = { 0 };
int n, m;
int main()
{
cin >> s + 1 >> p + 1;
m = strlen(s + 1);
n = strlen(p + 1);
//求next数组的过程
//类似于KMP匹配过程
for (int i = 2, j = 0;i <= n;i++)
{
while (j && p[i] != p[j + 1]) {
//判断j是否为0是因为跳回到第一个字符后就不用回跳了
j = Next[j];
}
if (p[i] == p[j + 1]) {
j++;
Next[i] = j;
}//通过自己匹配自己来得出每一个点的next值
}
cout << "Next数组:";
for (int i = 1;i <= n;i++) {
cout << Next[i] << ' ';
}
cout << endl;
//KMP匹配过程
for (int i = 1, j = 0;i <= m;i++)
{
while (j && s[i] != p[j + 1]) {
j = Next[j];
}//匹配失败后,j不断的回跳,直到可以匹配成功
if (s[i] == p[j + 1]) {
j++;
}//如果匹配正确,则对应的模式串位置++
cout << "j=" << j << endl;
//匹配成功
if (j == n) {
cout <<"匹配成功的起始位置:" << i - n << endl;
j = Next[j];
}
}
return 0;
}
随便输入一个例子来看看运行结果:
模式串:aba
文本串:abababc
把j一并输出出来可以更好的理解中间的循环过程。
作者是大一的蒟蒻,刚学KMP算法,写此文章来记录一下,以后有新的领悟了会重新增删修改,希望各位看客大佬能提出看法意见,也希望对看的这篇文的新手有点帮助^ _ ^