朴素的求母串S里有多少个子串T,就是母串里从1开始到末尾,截取和子串相同长度的一段字符串,和子串T比,一样就返回1不一样就继续取下一串。
要是子串里的字符都是不一样的就是这么比的,但是子串里要是有一些是重复的,这样比就多比了很多步。
next数组就是,把子串里各个字符位置的下标值定义为一个数组,告诉你这个位置识别出不同了,该跳到子串的哪里继续对比,可以少比一些;
求next数组的代码如下:
void get_next(String T,int next[])
int i=1,j=0;
//i表示后缀,j表示前缀
next[i] = 0;
while(i<T[0]){
if(j == 0 || T[i]==T[j]){
i++;
j++;
next[i] = j;
}
else{
j = next[j];
}
}
实质就是:子串自己和自己本身对比一下。
应用KMP算法的模式匹配代码如下:
//寻找s串pos位置后面和T串相同的子串位置
//没找到就返回0
int Index_KMP(String S,String T,int pos){
int i=pos;
int j=1;
int next[255];
get_next(T,next);
while(i<=S[0] && j<=T[0]){
if(j==0 || S[i] == T[j]){
//j==0表示母串向前移动一位
//子串从1开始对比
i++;
j++;
}
else{
j = next[j];
}
}
if(j >T[0]){
return i-T[0];
}
else{
return 0;
}
}
但是next数组还不是最优的,如果子串中失配的地方,和前缀元素一样,说明不用再跳到当前前缀元素的位置,因为前缀元素过来也是失配,所以跳到前缀元素的失配地址上
next数组修改
void get_nextval(String T,int next[]){
int i=1,j=0;
next[0] = 1;
while(i<T[0]){
if(j==0 || T[j] == T[i]){
i++;
j++;
if(T[i] != T[j]){
next[i] = j;
}
else{
next[i] =next[j];//前缀元素的失配跳跃地址给当前的值
}
}
else{
j = next[j];
}
}
}