KMP的next数据的计算方法的重点一直get不到,现在终于看懂了,趁热打铁把理解的过程记录下来。
next数组指的是字符串的最大的公共前后缀字符子串的长度。它的计算其实是一个动态规划的过程,将前面已经计算过的结果都保存在一个数组里面供后面查询。
画一个简单的示意图
如上图所示,求p[n]的最大前后缀字符串的长度,分为以下几种情况
已知:p[n-1]的最大公共字符子串的长度为k,即p[0]--p[k-1]。
(1) .当p[k] = p[n]
那么k = k + 1,公共的最大字符子串的长度要加1
(2). 当p[k] !=p[n]
这个地方非常的关键,比较难理解。我再画一个示意图。
如下图所示,公共字符子串C中假设有也有公共字符子串E和F,那么字符串E=F,而C=B 那么E=H,也就是说P[n]还要和字符串E的后一个字符比较,如果相等,那么公共字符子串的长度K++,如果不相等,再找E里面的公共字符子串。一直找到k= 0,那么就跳出循环。P[n] 和p[0]比较,如果相等,k=1,如果不想等,k=0;
最后再一直将字符串的所有的next数组的值都计算出来
贴代码
public static void makeNext(String s, int[] next) { next[0] = 0; int k = 0; int len = s.length(); for (int n = 1; n < len; n++) { while (k > 0 && s.charAt(n) != s.charAt(k)) { k = next[k - 1]; } if (s.charAt(n) == s.charAt(k)) k++; next[n] = k; } }