前言:最近在复习数据结构,又学到了KMP算法,之前学习的时候就有很多地方没有学懂,模模糊糊地就混过去了,今天想来做一个总结。本篇博客主要基于数据结构高分笔记,加上我自己地总结完成,来系统简洁地描述一下KMP算法,用C/C++实现。
1、简单模式匹配算法(暴力)
模式串的前部字串P1P2P3...Pj与主串中的一个子串Si-j+1Si-j+2...Si-1匹配,而Pj与Si不匹配。当出现这种情况时,简单模式匹配算法的做法时将i赋值为i-j+1,j赋值为0,再重新比较。
int index(char *s,char *p)
{
int i,j,lens,lenp;
i=0;j=0;
lens=strlen(s);
lenp=strlen(p);
while(i<lens&&j<lenp)
{
if(s[i]==p[j])
{
i++;
j++;
}else
{
i=i-j+1;
j=0;
}
}
if(j==lenp) return i-j;
else return -1;
}
即等同于以下写法:模式串首字符依次和主串的每一个字符比较,当匹配时,依次比较剩下的模式串字符,如果模式串全部匹配成功,则返回主串中匹配的第一个字符的位置。
#include<stdio.h>
#include<iostream>
#include<string.h>
using namespace std;
char str1[101];
char str2[101];
int main(){
int i,len1,len2,j;
bool flag;
while(scanf("%s %s",str1,str2)!=EOF)
{
len1=strlen(str1);
len2=strlen(str2);
flag=false;
for(i=0;i<len1;i++)
{
if(str1[i]!=str2[0]) continue;
for(j=0;j<len2&&(i+j)<len1;j++)
{
if(str1[i+j]!=str2[j])
{
break;
}
}
if(j==len2)
{
flag=true;
break;
}
}
if(flag==true) printf("Yes\n");
else printf("No\n");
}
return 0;
}
这里的暴力匹配算法需要i不断地回溯,即使前面已经匹配了一定长度地字符串,这会使时间复杂度大大增加。接下来要说地KMP算法i则不需要回溯,只有j不断地向前增加。
2、KMP算法
如图所示,当主串和模式串到某一位不匹配时,i不变,j变为next[j],此时next[j]值为2,即模式串相对主串向左移动了6-2=4位。为什么j会变为2呢,因为你可以发现AB两个字符又是匹配的。
相当于在除去字符D的模式串子串中寻找相同的前缀和后缀,然后根据前缀后缀求出next 数组,最后基于next 数组进行匹配。
int KmpSearch(char *s,char *p,int next[])
{
int i,j,lens,lenp;
i=0;j=0;
lens=strlen(s);
lenp=strlen(p);
while(i<lens&&j<lenp)
{
if(j==-1||s[i]==p[j])
{
i++;
j++;
}else
{
j=next[j];
}
}
if(j>=lenp) return i-j;
else return -1;
}