【算法学习】KMP入门

最新推荐文章于 2022-11-11 13:03:02 发布

pengwill97

最新推荐文章于 2022-11-11 13:03:02 发布

阅读量151

点赞数

分类专栏：算法学习

本文链接：https://blog.csdn.net/pengwill97/article/details/80978159

版权

算法学习专栏收录该内容

23 篇文章 8 订阅

订阅专栏

KMP算法入门
next数组的求解
- next数组的含义
- next数组求解代码
如何进行匹配

KMP算法入门

KMP解决的是模式串 $S$ 和文本串 $T$ 之间的匹配问题。传统和暴力算法，在复杂度方面不够优秀，根本原因在于对模式串没有的规律没有加以利用，导致进行了多余的匹配。而KMP算法的关键也在于 $next$ 数组，求解出了模式串 $next$ 数组，也就求解出来了对于当前模式串在某一位置失配后，接下来去哪一位置进行匹配的问题。有了这个从而提高在匹配过程中的效率。

next数组的求解

对文本串和模式串进行如下的规定：
$|S|=n,|T|=m,S=s_0s_1\dots s_{n-1},T=t_0t_1\dots t_{m-1}$

对 $next$ 数组的理解，可以为：如果当前在模式串 $S$ 中的某一位置 $x$ 发生失配，即在主串 $T$ 中某一可能的位置 $y$ ,如果有 $s_x \neq t_y$ ，对于模式串来说，应该用其的哪个字符接着和 $s_x$ 进行比较。

从上述描述中，不难发现，对于主串的指针，在失配的时候是不回退的。而在传统的暴力求解算法上，如果发生了失配，主串的指针是要回退到模式串头部对应主串的位置+1的位置上，这样的回退，显然效率很低。从这个角度上来看，也说明了KMP有很好的效率。

next数组的含义

$next$ 数组的含义已经说过，其更本质的含义是，对于模式串的某一位置 $x$ ， $s_0s_1\dots s_{x-1}$ 的前缀和后缀相同的最大长度。这样说还不够具体，用一个实例来描述一下。

假设有模式串 $S = ababaca$

$x$	串	最长前缀和最长后缀相同的串	最长长度	$next$ 值
0	$a$	$null$	0	-1
1	$ab$	$null$	0	-1
2	$aba$	$a$	1	0
3	$abab$	$ab$	2	1
4	$ababa$	$aba$	3	2
5	$ababac$	$null$	0	-1
6	$ababaca$	$a$	1	0

解释一下上表，如当 $x=6$ 时，模式串最后发生了失配，也就是最后的 $a$ 和文本串不匹配，在保证主串指针不回退的情况下，那么主串该和模式串的哪个字符来比较了，显然是第0个字符，也就是开头的 $a$ .

再比如，当 $x = 4$ 的时候发生失配，那么下面就是主串的模式串的第2个字符进行比较。

next数组求解代码

void getnext(){
    int len = strlen(str),k = -1;
    nxt[0] = -1;
    for(int i = 1;i<=len-1;++i){
        while(k>-1&&str[k+1]!=str[i]) k = nxt[k];
        if(str[k+1] == str[i]) k++;
        nxt[i] = k;
    }
}

如何进行匹配

T o B e c o n t i n u e d

$To \ Be \ continued$

pengwill97

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【算法学习】KMP入门

KMP算法入门next数组的求解next数组的含义next数组求解代码如何进行匹配KMP算法入门KMP解决的是模式串SSS和文本串TTT之间的匹配问题。传统和暴力算法，在复杂度方面不够优秀，根本原因在于对模式串没有的规律没有加以利用，导致进行了多余的匹配。而KMP算法的关键也在于nextnextnext数组，求解出了模式串nextnextnext数组，也就求解出...
复制链接

扫一扫

专栏目录