KMP算法 next函数代码解析

最新推荐文章于 2024-08-11 21:56:02 发布

ice110956

最新推荐文章于 2024-08-11 21:56:02 发布

阅读量3.4k

点赞数 5

分类专栏：算法与ACM 文章标签： KMP 源码解析

本文链接：https://blog.csdn.net/ice110956/article/details/9388509

版权

算法与ACM 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

KMP算法很早就接触了，记得自己看着代码也能理解实现，但是时间已久总是忘了如何编码，也许是自己对于next函数的理解一直停留在记忆层面上。

现在把KMP的next函数拿出来，看看能不能分析出一个门道，理解了它的逻辑，方式，才会记得比较熟悉吧。

KMP的思想这里不探讨了，直接上next函数的代码来分析。

void next(const char *T, int next[])
{
       int j = 0, k = -1;//两个位置指针，j表示当前匹配指针。
	   //j,k都代表了当前重复子串后的位置。即图（1）的F和D位置
       next[0] = -1;
	   //把第一个的位置置为-1，表示从头开始匹配
       while ( T[j] != '\0' )//while循环
       {
              if (k == -1 || T[j] == T[k])
              {
                     ++j; ++k;
                     if (T[j]!=T[k])
                            next[j] = k;
                     else
                            next[j] = next[k];
              }
              else
                     k = next[k];
       }
}

个人理解，这个next函数有两个目的，1.求一个最长重复序列;2.根据最长序列求回溯位置。

1.最长重复子序列：

比如ABCDABC,这个序列的最长重复字序列式ABC，当然，这里的最长重复要满足要求，前一个顶头，后一个顶着尾巴。如下图（1）所示。
CABCDABC,这个序列ABC子序列不满足前一个顶头的要求，所以这个序列的最长公共子序列是C。

2.回溯位置。如图一，F之前的最长子序列求出来以后，我们目的是计算F的回溯位置。按照理解，我们匹配失败后，可以让F回溯到D的位置，因为它们的前缀是相同的。

程序里还加了一个判断条件，就是继续还要判断F与D是否相等，如果相等，即都为F，那么F失败的时候回溯回来也是错误的，那么我们就然F指向D之前的位置。