今天重新复习了kmp
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)。
不用kmp暴力去做的话,时间复杂度最坏为O(n*m),显然这不能解决我们对时间的追求。
关于kmp,核心就是pmt(即字符串前缀子串与后缀子串相等的最长长度)
举个例子:aba={"a","ab","aba"}(前缀子串),aba={"a","ab","aba"}(后缀子串),很显然pmt = 3;
这个例子可能不那么具有普适性,再举一个:abcdba={"a","ab","abc","abcd","abcdb","abcdba"}(前缀子串),abacdba={"a","ab","abd","abdc","abdca","abdcab","abdcaba"}(后缀子串).很显然pmt=2;
可视化一下吧,对于经典例子“ababcabaa”
index | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
char | a | b | a | b | c | a | b | a | a |
pmt | 0 | 0 | 1 | 2 | 0 | 1 | 2 | 3 | 1 |
pmt[i]的意义就是字符串s从0往后数,从i往前数,在前缀与后缀相等的前提下,最多能数多少
kmp的博客
https://zhuanlan.zhihu.com/p/83334559
https://zhuanlan.zhihu.com/p/105629613
https://www.zhihu.com/question/21923021/answer/281346746
代码模板:
void get_pmt(const string& s) {
for(int i = 1, j = 0; i < s.size(); i++)
{
while(j && s[i] != s[j]) j = pmt[j - 1];
if(s[i] == s[j]) j ++;
pmt[i] = j;
}
}
void kmp(const string& s, const string& p) {
for(int i = 0, j = 0; i < s.size(); i++)
{
while(j && s[i] != p[j]) j = pmt[j - 1];
if(s[i] == p[j]) j ++;
if(j == p.size())
{
std::cout << i - j + 2 << "\n";
j = pmt[j - 1];
}
}
}