#include <iostream>
#include <cstring>
using namespace std;
int next[20];//如果除首字符之外的字符只出现一次,那么next值就为0,如果出现的次数不为1,那么就求出第一次出现的位置
char text[20]="BBC ";
char p[20]="ABCDABD";
void getNext(char *p,int *next) {
int j,k;
next[0]=-1;
j=0;
k=-1;
while(j<strlen(p)-1)//当j等于strlen(p)-1时,我们已经全部赋完值了
{
k++;
next[j]=k;//因为每次赋完值后还会再比较一次,如果不匹配的话,那么k值自然变为-1,那么next的值自然为0,如果匹配的话,因为next[j+1]=next[j]+1=k+1;所以j++了,k++了
}
else
{
int i,j;
i=0;
j=0;
getNext(p,next);
while(i<strlen(s))
{
if(j==-1 || s[i]==p[j])
{
i++;
j++;
}
else
{
j=next[j];//避免了i的重新回溯,直接让j等于next[j],如果那个字符只出现了一次,那么直接就是让p重新从0开始比较,如果出现多次,那么next值为第一次出现的位置,因为s[i]和p[j]还是不相等,同样p重新从0开始比较
}
if(j==strlen(p))//如果j等于p的长度的话,意味着我们已经找到了,自然返回它所在的位置
return i-strlen(p);
}
return -1;
}
int main()
{
int q;
getNext(p,next);
for(int i=0;i<strlen(p);i++)
{
cout<<next[i]<<endl;
}
q=KMPMatch(text,p);
//cout<<q<<endl;
return 0;
}
因此KMP算法的关键在于求算next[]数组的值,即求算模式串每个位置处的最长后缀与前缀相同的长度, 而求算next[]数组的值有两种思路,
第一种思路是用递推的思想去求算,还有一种就是直接去求解。
1.按照递推的思想:
根据定义next[0]=-1,假设next[j]=k, 即P[0...k-1]==P[j-k,j-1]
1)若P[j]==P[k],则有P[0..k]==P[j-k,j],很显然,next[j+1]=next[j]+1=k+1;
2)若P[j]!=P[k],则可以把其看做模式匹配的问题,即匹配失败的时候,k值如何移动,显然k=next[k]。
因此可以这样去实现:
void getNext(char *p,int *next)
{
int j,k;
next[0]=-1;
j=0;
k=-1;
while(j<strlen(p)-1)
{
if(k==-1||p[j]==p[k]) //匹配的情况下,p[j]==p[k]
{
j++;
k++;
next[j]=k;
}
else //p[j]!=p[k]
k=next[k];
}
}
其实这个我自己也没有理解透彻,大概的意思能狗理解
#include <cstring>
using namespace std;
int next[20];//如果除首字符之外的字符只出现一次,那么next值就为0,如果出现的次数不为1,那么就求出第一次出现的位置
char text[20]="BBC ";
char p[20]="ABCDABD";
void getNext(char *p,int *next) {
int j,k;
next[0]=-1;
j=0;
k=-1;
while(j<strlen(p)-1)//当j等于strlen(p)-1时,我们已经全部赋完值了
{
if(k==-1 || p[j]==p[k])//匹配的情况下,p[j]==p[k],那么从p[0]~p[k-1]就和p[j-k]~p[j]完全相同
{
k++;
next[j]=k;//因为每次赋完值后还会再比较一次,如果不匹配的话,那么k值自然变为-1,那么next的值自然为0,如果匹配的话,因为next[j+1]=next[j]+1=k+1;所以j++了,k++了
}
else
k=next[k];//不匹配,自然就让k=next[k],没必要再回溯
}
}
int KMPMatch(char *s,char *p){
int i,j;
i=0;
j=0;
getNext(p,next);
while(i<strlen(s))
{
if(j==-1 || s[i]==p[j])
{
i++;
j++;
}
else
{
j=next[j];//避免了i的重新回溯,直接让j等于next[j],如果那个字符只出现了一次,那么直接就是让p重新从0开始比较,如果出现多次,那么next值为第一次出现的位置,因为s[i]和p[j]还是不相等,同样p重新从0开始比较
}
if(j==strlen(p))//如果j等于p的长度的话,意味着我们已经找到了,自然返回它所在的位置
return i-strlen(p);
}
return -1;
}
int main()
{
int q;
getNext(p,next);
for(int i=0;i<strlen(p);i++)
{
cout<<next[i]<<endl;
}
q=KMPMatch(text,p);
//cout<<q<<endl;
return 0;
}
因此KMP算法的关键在于求算next[]数组的值,即求算模式串每个位置处的最长后缀与前缀相同的长度, 而求算next[]数组的值有两种思路,
第一种思路是用递推的思想去求算,还有一种就是直接去求解。
1.按照递推的思想:
根据定义next[0]=-1,假设next[j]=k, 即P[0...k-1]==P[j-k,j-1]
1)若P[j]==P[k],则有P[0..k]==P[j-k,j],很显然,next[j+1]=next[j]+1=k+1;
2)若P[j]!=P[k],则可以把其看做模式匹配的问题,即匹配失败的时候,k值如何移动,显然k=next[k]。
因此可以这样去实现:
void getNext(char *p,int *next)
{
int j,k;
next[0]=-1;
j=0;
k=-1;
while(j<strlen(p)-1)
{
if(k==-1||p[j]==p[k]) //匹配的情况下,p[j]==p[k]
{
j++;
k++;
next[j]=k;
}
else //p[j]!=p[k]
k=next[k];
}
}
其实这个我自己也没有理解透彻,大概的意思能狗理解