如果不了解kmp算法,可以看一下这篇文章:点击打开链接
如果字符串是s=ababcaabc。
在kmp算法中,有两种方法求next数组,一种是:(未改进的,正常的)
void pre(int len)
{
int i = 0, j = -1;
next[0] = -1;
while(i != len)
{
if(j == -1 || pattern[i] == pattern[j])
next[++i] = ++j;
else
j = next[j];
}
}
这种方法的next数组的含义是:前缀和后缀的最大匹配值。
对应s的next分别是:-1 -1 0 1 -1 0 0 1 -1
另一种是:(改进的)
void pre(int len) //前缀函数(滑步函数)
{
int i = 0, j = -1;
next[0] = -1;
while(i != len)
{
if(j == -1 || pattern[i] == pattern[j]) //(全部不相等从新匹配 || 相等继续下次匹配)
{
++i, ++j;
if(pattern[i] != pattern[j]) //abcdabce
next[i] = j;
else //abcabca
next[i] = next[j];
}
else
j = next[j]; //子串移动到第nextval[j]个字符和主串相应字符比较
}
}
对应s的next数组分别是:-1 0 -1 0 2 -1 1 0 2
我一般用这个代码:(改进的)
void pre()
{
next[0]=-1;
int j=-1;
for(int i=1;i<m;i++)
{
while(j>=0&&pattern[j+1]!=pattern[i])j=next[j];
if(pattern[j+1]==pattern[i])j++;
next[i]=j;
}
}
对应的next数组分别是:-1 -1 0 1 -1 0 0 1 -1
在求前缀和后缀的最大匹配值时,要用第一种。在运用kmp时要用第二种,效率更高。
一个串的最小循环节长度是:len-next[len]。(第一种方法)
如果len%(len-next[len])==0,那么这个字符串的最小周期就是:len/(len-next[len]).