KMP模式匹配算法中next数组的代码分析:
<pre name="code" class="cpp"><span style="font-family:Microsoft YaHei;font-size:18px;">/*
#include <stdio.h>
void get_next(char *t, int *next);
int main()
{
char t[] = "0ababaaaba";
int next[10];
t[0] = 9;
get_next(t, next);
return 0;
}
*/
/* 通过计算返回子串T的next数组 */
void get_next(char *t, int *next)
{
int i, j;
i = 1;//i是当前比较的后缀的最后一个字符的下标,当前所求的是next[i+1]的值
j = 0;//j是与前缀中与后缀相同的最后一个字符的下标或者是要与后缀最后一个字符比较的字符下标
next[0] = 0;//next[0]不使用,赋0防止出错
next[1] = 0;//KMP算法中next[1]恒为0,表示第一个字符主串与子串T就不同,在j==0的if语句中将next[++i]设为1
while (i < t[0])//t[0]表示串t的长度,此时求的next[i+1]已是最后一个位置
{
if (j == 0 || t[i] == t[j])/*t[i]表示后缀的单个字符,t[j]表示前缀的单个字符*/
/*j == 0表示1~i的子串后缀和前缀不相等,此时next[i的] = 1*/
/*t[i] == t[j] 表示1~j的前缀与(i-j+1)~i的后缀相等,next[++i] = ++j*/
{
++i;
++j;
next[i] = j;
}
else//以(i-j+1)~i的后缀为主串,1~j的前缀为子串进行KMP匹配,第i个与第j个匹配失败,使j=next[j]进行下一次匹配
{
j = next[j];//1~j的前缀为子串时的next数组与原子串T的next数组的前j位是相同的
}
}
}</span>
改进型KMP算法中nextval数组代码分析:
#include <stdio.h>
void get_nextval(char *t, int *nextval);
int main()
{
char t[] = "0ababaaaba";
int nextval[10];
t[0] = 9;
get_nextval(t, nextval);
return 0;
}
/*求子串T的改进型KMP模式匹配算法中的next数组的修正值nextval*/
void get_nextval(char *t, int *nextval)
{
int i, j;
i = 1;
j = 0;
nextval[0] = 0;
nextval[1] = 0;
while (i < t[0])
{
if (j == 0 || t[i] == t[j])
{
++i;
++j;
if (t[i] != t[j])//如果当前字符t[++i]与刚才匹配的前缀的最后一个字符的后一个字符t[++j]即当前位置++i匹配失败时进行下一次匹配的位置j的字符不相等
{
nextval[i] = j;//按原来的算法进行,当前位置++i匹配失败时进行下一次匹配的位置nextval是j
}
else//如果当前字符t[++i]与当前位置++i匹配失败时进行下一次匹配的位置j的字符相等,用本来进行下一次匹配的j位置的nextval值作为当前位置++i的nextval
{
nextval[i] = nextval[j];
}
}
else
{
j = nextval[j];
}
}
}