这两日看kmp算法,看的脑袋大了,最关键发现next数组表现形式不一,让我头疼,
现在终于搞明白了他们之间的关系,分析如下,
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
P[i] | a | b | a | b | a | c | a |
S[i] | 0 | 0 | 1 | 2 | 3 | 0 | 1 |
f(i) | 0 | 1 | 1 | 2 | 3 | 4 | 1 |
S[i]是指,出现的不匹配的位置i,以前面的一个位置i-1结尾的后缀匹配个数,计算时,要比较跳转后的下一个位置来和文本中的未匹配字符比较,这是算法导论中的做法
f(i)是指,未匹配的文本下一个要匹配的模式的下标,就是下一个比较模式的哪个元素,它代表比如说,i=5时,前面的i=3,i=4是匹配的后缀,所以可以跳到这个位置,这是kmp原论文和好多博客中的做法
然后第三种:
对f(i)进行优化,比如i=3时,调到 i=1进行比较,而p[1]=p[3],下一步还是错匹,所以直接把f(3)变为0, 这样优化后的做法,f(i)变为如下形式:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
f(i) | 0 | 1 | 0 | 0 | 0 | 4 | 0 |
再补充一点关于kmp算法的复杂度分析的感想,真的是理解摊还分析的好例子,算法导论中用聚合分析的方法来计算,基本就是瞄准模式的下标j来分析。
收工