含义
在求解next数组之前要明确next数组是干什么的,它的值是存储的什么。next数组的值是字串的前缀与后缀相同的最大长度,但不包括自身。
求解规则
next的数组的第一位,第二位的初始化值为0,1,因为第一位前面没有字符,故为0。我们能确定next数组第一二位一定分别为0,1,后面求解每一位的next值时,根据前一位进行比较。从第三位开始,将前一位与其next值对应的内容进行比较,如果相等,则该位的next值就是前一位的next值加上1;如果不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值;如果找到第一位都没有找到与前一位相等的内容,那么求解的位上的next值为1。
那么我们还知道如果子串与主串失配的话,主串是不动的,移动的是子串,而子串最坏的情况是移动到第一个位置,那么next数组从第二位开始即初始化为1,如果该某一位置失配时前有相等前后子串,则返回其相等子串的长度+1,没有则返回1位置。
下面给出一串例子:
根据我们前面讲的规则,前两位先分别附上0,1。
然后看第三位a,a前面没有可匹配的,+0,next数组的第三位可以赋上1了。
第四位a,第四位前的前后字串分别为a,ab;a,ba,有相同“a”串,长度为1,+1,第四位赋值2。
第五位a,同理前后串为a,ab,aba;a,aa,baa,相同的还是“a”串,第五位赋值2。
第六位b,分析之后的,最长相等字串还是“a”,第六位赋值2。
接下来分别为3,1,2,2。
你会算了吗?
最终我们得到的next数组为:0 1 1 2 2 2 3 1 2 2
到此为止我们已经可以手算next数组了,这也是考研数据结构的要求之一,接下来我们还要用代码具体实现next数组的求法。
代码实现
在代码实现中,我们通常把next[0]赋值为-1,也就是第一位从-1开始,那么上面的例子的next数组就变成了:-1 0 0 1 1 1 2 0 1 1
void next(int len)//next数组
{
int i=0,j=-1;
next[0]=-1;
while(i<len)//子串中每个字符前的对称字符串长度存入next数组中比如abcdabce,e就是3(abc=abc)
{
if(j==-1||b[i]==b[j])
{
i++;
j++;
next[i]=j;
}
else
{
j=-1;//再从头开始比较
}
}
}
代码分析
next数组 | -1 | 0 | ||
---|---|---|---|---|
原字符串 | a | b | a | a |
下标 | 0 | 1 | 2 | 3 |
当代码走第一遍时,j=-1,进入if语句。i++,j++,i的值为1,j的值为0,next[1]=0,这时i,j分别指向字符串的第二和第一个位置;第二遍走,j!=-1而且next[i]!=next[j],此时前后字符串失配,j回到初始位置赋值为-1,i不动,next[2]=0。
next数组 | -1 | 0 | 0 | 1 |
---|---|---|---|---|
原字符串 | a | b | a | a |
下标 | 0 | 1 | 2 | 3 |
第三次走时i到了第三个位置,i=1,j=-1,满足if语句,i++,j++,i=2,j=0,next[2]=0,第四次再一次进入if语句,此时满足next[i]=next[j],next[3]=j=1,完成next数组。