KMP 简介
百度百科:
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)
KMP解释
全有注释,别问,问就是模板,具体看算法导论第32章
KMP算法
#include <iostream>
#include <algorithm>
#include <cstring>
#include <cstdio>
using namespace std;
const int N = 1000000 + 5;
char T[N], P[N];//T 模板字符串 P 模式字符串
int net[N]; //net[i]包含第i个字符的与真后缀相等的最长前缀长度
void TONext(char *P){ //与KMP子函数基本一致,可看成2个相同的字符串(P)匹配 ,唯一不同的是保存了net数组
int Plen = strlen(P + 1); //字符串从第1项输入
int k = 0; //为前缀字符串开始,去匹配另外一个P模式(此时可看作模板) 0表示还未开始
net[1] = 0; //1个字母 0
for(int i = 2; i <= Plen; i ++ ){ //匹配到第i位
while(k > 0 && P[k + 1] != P[i])
k = net[k]; //不行,移动字符串(KMP),重新开始匹配,
//但不同于常规匹配(从新开始),从net[k]开始(就是KMP)
if(P[k + 1] == P[i]) k ++;
net[i] = k; //唯一不同KMP子函数,保存了P中每一位的 与真后缀相等的最长前缀长度
/*
a b a b a c a
a b a b a c a
*/
}
}
void KMP(char *T, char *P){ //本质上可以看成移动P模式串
int Plen = strlen(P + 1), Tlen = strlen(T + 1);
TONext(P); //得到net[1……Plen]
int q = 0; //0表示模式字符串未开始
for(int i = 1; i <= Tlen; i ++ ){
while(q > 0 && P[q + 1] != T[i])
q = net[q]; //与常规操作回溯i不同:不相等 P模式字符串右移动 q - net[q](相对q左移到net[q],i不变)
if(P[q + 1] == T[i]) q ++; //相等继续比较下一位,与常规方法一只
if(q == Plen){ // 说明匹配完成
printf("%d\n", i - Plen + 1); //输出从第几项开始匹配完成
q = net[q]; // 寻找下一个匹配的模式字符串P
}
}
for(int i = 1; i <= Plen; i ++ )
printf("%d ", net[i]); //输出Π(i) 包含第i个字母的最长前缀长度
printf("\n");
}
int main()
{
scanf("%s%s", T + 1, P + 1);
KMP(T, P);
return 0;
}
结束
蒟蒻的模板咕咕咕