KMP算法在数据结构(C语言版)里算是比较难的地方了,难就难在next数组的求法,但偏偏很多资料在这一点都比较含糊,下面是我学完KMP的一些思考和代码。
一、定位函数(暴力法)
#include<iostream>
#include<cstdio>
#include<string>
using namespace std;
int index(string s,string t,int pos){
int i=pos;
int j=0;
int slen = s.length();
int tlen = t.length();
while(i<slen&&j<tlen){
if(s[i]==t[j]){ i++,j++;}
else{
i=i-j+1;
j=0;
}
}
if(j==tlen) return i-tlen;
return -1;
}
二、KMP的模式匹配
见详细图文思路:https://www.cnblogs.com/yjiyjige/p/3263858.html#!comments(作者:孤~影,语言:java)
讲点别的:
实际上KMP就是将模式串向右滑动,如果记录每个模式串的前后相等的字串,然后下次可以直接往右移到指定的位置继续匹配,从而减少无意义的匹配。
关键就是求next数组,当P[j]==P[k]时,next[++j]=++k;当P[j]!=P[k]时,等于是自己模式匹配自己,k=next[k]。
ps:记住string对象的length()方法,返回的是一个unsigned int,不能拿它和int 类型的i(j)比较,int类型会被强转为unsigned int,如果i是-1,那么在unsigned int中是最大值(因为补码,int和unsigned int不一样)
#include<iostream>
#include<cstring>
#include<string>
#include<cstdio>
using namespace std;
int next[30];
void get_next(string t){
int i=0;
next[0]=-1;
int k=-1;
int tlen = t.length();
while(i<tlen-1){
if(k==-1 || t[i]==t[k])
next[++i]=++k;
else k=next[k];
}
}
int KMP(string s,string t){
int i=0;
int j=0;
get_next(t);
int slen = s.length();
int tlen = t.length();
while(i<slen&&j<tlen){
if(j==-1||s[i]==t[j]){
i++,j++;
}
else {
j=next[j];
}
}
if(j==tlen) return i-j;
else return -1;
}
int main(){
string s1,s2;
cin>>s1>>s2;
cout<<KMP(s1,s2)<<endl;
}