KMP算法难点讲解-next数组计算原理
一般的教科书或者解析会给出得到next数组的代码:
def get_next(substring): i = 1 j = 0 num = len(substring) next = [0 for i in range(num)] while (i < num): if (j == 0 or substring[j] == substring[i]): j += 1 i += 1 next[i] = j else: j = next[j] #让我失眠到两点的一句代码,《大话数据结构》里面只是简单的说j要回溯。开始不认同talk is cheap, show me the code!这句话了。求你多talk一下。 return next
要理解这段话也不是太难,只需要理解next_point[j]的含义:长度为j的数组在去掉第j个字符之后前缀和后缀相等的最大长度+1;
其次,当substring[j] != substring[i]时,有两层含义:
(1)前缀的第j个字符与后缀的第j个字符不相同,而前缀的1:(j-1)个字符串与后缀的1:(j-1)个字符串相同
意味着j必须回退,那么应该回退到哪里呢?最终我们的问题就转化为j只需要回退到前j-1个字符串的前缀和后缀相等的最大长度+1。