KMP的算法核心,在于引入next值,在对待查串做增量之外,避免了对子串逐一增加并一一比较。对于子串有较多重复内容,提高了效率。
由于T="abcabx",此时分析x的next值,前缀的“ab”与最后“x”之前串的后缀“ab”是相等的。因此j就由6变成了3。因此,我们可以得出规律,j值的多少取决于当前字符之前的串的前后缀的相似度。
换言之,理解的关键,对于j位置的字符,观察最前面的字符,与j之前紧邻j最后的字符,其相同串的最大长度,即为相似度。
由于T="abcabx",此时分析x的next值,前缀的“ab”与最后“x”之前串的后缀“ab”是相等的。因此j就由6变成了3。因此,我们可以得出规律,j值的多少取决于当前字符之前的串的前后缀的相似度。
换言之,理解的关键,对于j位置的字符,观察最前面的字符,与j之前紧邻j最后的字符,其相同串的最大长度,即为相似度。
KMP模式算法的改进的关键在于,对于T串(待查找的串),如果T串的第二、三、四、五位置的字符都与首位相等,那么可以用首位的next值,即next[1]去取代后续next的值。
//KMP算法
//T[i]表示后缀的单个字符,T[j]表示前缀的单个字符
void get_next(String T, int *next)
{
int i = 1, j = 0;
next[1] = 0;
while (i < T[0])
{
if (j == 0 || T[i] == T[j])
{
i++;
j++;
next[i] = j;
}
else
j = next[j];
}
}
int Index_KMP(String S, String T, int pos)
{
int i = pos;
int j = 1;
int next[255];
get_next(T, next);
while (i <= S[0] && j <= T[0])
{
if (j == 0 || S[i] == T[j])
{
i++;
j++;
}
else
j = next[j];
}
if (j > T[0])
return i - S[0];
else
return 0;
}
//改进的KMP算法计算next值
void get_nextval(String T, int *nextval)
{
int i = 1, j = 0;
nextval[1] = 0;
while (i < T[0])
{
if (j == 0 || T[i] == T[j])
{
i++;
j++;
if (T[i] != T[j])
nextval[i] = j;
else
nextval[i] = nextval[j];
}
else
j = nextval[j];
}
}