KMP是字符串匹配的一种常用方法。理解KMP,我们得先从暴力思想来讲。
如果我们进行暴力字符串匹配,假设文本串s匹配到s[i],模式串匹配到p[j],若s[i]==p[j],则i++,j++,否则i=i-j+1,j=0。相当于一位一位枚举下去。
但这样一位一位枚举实在太慢了,如果我们能标记某些段的字符串(这些串肯定不匹配),当匹配到当串时,直接跳过,就可以极大地提升时间复杂度。而这个标记也就是KMP的next数组。
对于一个字符串p,next[i]表示到第i-1位时,最大的相等的前缀后缀长度。例如对于字符串ABABAC,next[4]=1(字串A),next[5]=2(字串AB),next[6]=1(字串A)。
当我们匹配到s[i]!=p[j]时,i不变,而j变为next[j],这样继续匹配就可以完成KMP。
推荐博客
next求解函数
void getnext(){
nxt[0]=-1;
int k=-1,j=0;
while(j<l2){
if(k==-1||c2[k]==c2[j]){
j++; k++;
nxt[j]=k;
}
else{
k=nxt[k];
}
}
}
KMP主函数
void KMP(){
int i=0,j=0;
while(i<l1){
if(j==-1||c1[i]==c2[j]){
i++; j++;
}
else j=nxt[j];
if(j==l2) printf("%d\n",i-j+1),j=nxt[j];
}
}
KMP字符串匹配完整模板
#include<bits/stdc++.h>
using namespace std;
char c1[1000005],c2[1000005];
int l1,l2,nxt[1000005];
void getnext(){
nxt[0]=-1;
int k=-1,j=0;
while(j<l2){
if(k==-1||c2[k]==c2[j]){
j++; k++;
nxt[j]=k;
}
else{
k=nxt[k];
}
}
}
void KMP(){
int i=0,j=0;
while(i<l1){
if(j==-1||c1[i]==c2[j]){
i++; j++;
}
else j=nxt[j];
if(j==l2) printf("%d\n",i-j+1),j=nxt[j];
}
}
int main(void)
{
cin>>c1;cin>>c2;
l1=strlen(c1);l2=strlen(c2);
getnext();
KMP();
for(int i=1;i<=l2;i++) printf("%d ",nxt[i]);
return 0;
}