前言
KMP是一种字符匹配算法,用于判断子串在母串中出现的次数和位置
假设有两个字符串,S1和S2(暂定S1为母串,S2为子串),问母串中有几个子串?
例1:S1:abababab
S2:abab
结果:3
例2:S1:absab
S2:ab
结果:2
数据类型
建立两个字符型数组存母子串就OK了
// 数据类型
char arr[1000], brr[1000];//arr存母串,brr存子串
int nextt[1000], sun;//nextt下面会讲
先看NEXT数组代码,后有讲解
void GetNext(char arr[])
{
int i = 0, j = -1;
nextt[0] = -1;
while (i < strlen(arr)) {
if (j == -1 || arr[i] == arr[j]) {
i++; j++;
nextt[i] = j;
}
else j = nextt[j];
}
}
上面是next数组的求法,用于标记跳转位置。关于next的用法,还是看视频吧。
next用法
再看匹配代码,后讲解
int KMPlindex(char arr[], char brr[]){
int i = 0, j = 0;
while (i < strlen(arr)) {
if (j == -1 || arr[i] == brr[j]) {
i++;j++;
if (j == strlen(brr)) {
sun++;
j = 0;
}
}
else j = nextt[j];
}
return sun;
}
附上完整代码一
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cmath>
using namespace std;
int next[100],n,s=0,S=0,m;
char arr[100],brr[100];
void Next(){
int i=1,j=0;
next[0]=-1;
while(i<n){
if(brr[i]== brr[j] || j == -1){
i++;
j++;
next[i]=j;
}
else{
j=next[j];
}
}
}
int main()
{
gets(arr);
gets(brr);
n=strlen(arr);
m=strlen(brr);
Next();
int i=0,j=0;
while(i<n){
if(arr[i]==brr[j]||j==-1){
i++;
j++;
if(j==m){
S++;
j=next[j];
}
}
else j=next[j];
}
cout << S << endl;
}
附上完整代码二(这个是最好的)
#include<iostream>
#include<cstdlib>
#include<string>
#include<algorithm>
#include<cstdio>
#include<math.h>
#include<cstring>
#include<stack>
#include<queue>
#include<iomanip>
#include<map>
#include<set>
#include<functional>
using namespace std;
char arr[1000], brr[1000];
int nextt[1000], sun;
void GetNext(char arr[])
{
int i = 0, j = -1;
nextt[0] = -1;
while (i < strlen(arr)) {
if (j == -1 || arr[i] == arr[j]) {
i++; j++;
nextt[i] = j;
}
else j = nextt[j];
}
}
int KMPlindex(char arr[], char brr[]){
int i = 0, j = 0;
while (i < strlen(arr)) {
if (j == -1 || arr[i] == brr[j]) {
i++;j++;
if (j == strlen(brr)) {
sun++;
j = 0;
}
}
else j = nextt[j];
}
return sun;
}
int main()
{
while ((cin >> arr)&&(arr[0] != '#')){
sun = 0;
cin >> brr;
GetNext(brr);
cout << KMPlindex(arr, brr) << endl;
}
return 0;
}
总结
KMP是个好东西,但是没必要死磕,其实背模板比搞清楚更重要
总结二
KMP需要一定理解,最好可以盲敲,一定一定