KMP算法概要

最新推荐文章于 2022-05-12 23:06:28 发布

「已注销」

最新推荐文章于 2022-05-12 23:06:28 发布

阅读量317

点赞数

本文链接：https://blog.csdn.net/kingdring/article/details/109557458

版权

前言
经典空间换时间算法看了贼久才看懂网上的博客文章有很多但是基本都很复杂从头到尾说一遍我是真的没那精力和耐心因此这篇只说一下最核心的几个问题
写的更多是我的思考的过程希望能对大家有帮助
请结合jlu数据结构课本食用
~~kmp这三个老家伙一个比一个顶~~
网上的很多文章中对于失败函数的定义并不相同但是大体思路一致请注意本文f()的含义

kmp算法

为什么会有kmp算法？

我们知道最简单的字符串匹配方法是暴力破解，即将模式串与主串从第一位开始匹配，若不成功则让模式串从主串第二位开始匹配，一直到模式串末尾与主串末尾重合为止。
不用想也知道这种算法虽然简单但是极其耗时
为什么？
因为在对失败位置之前的n个字符进行匹配的过程中我们已经 获得了前n个字符的信息 而不对这些信息进行判断直接从初始位置的下一位开始匹配是对已知信息的一种浪费
如何改进？

//举个栗子
主串：  abaaabab（s）
模式串：abab（p）

这时我们已经知道p[0]=p[2] p[1]=p[3]
开始第一次匹配结果为 s[0]=p[0] s[1]=p[1] s[2]=p[2] s[3]!=p[3]
这时按照爆破算法第二次应当逐一匹配

主串：   abaaabab（s）
模式串： _abab（p）

即比较s[1]与p[0] s[2]与p[1] s[3]与p[2] s[4]与p[3]
而我们第一次匹配已经知道
s[1]=p[1] s[2]=p[2]
所以第二次匹配如果想要成功
起码要满足前提 p[1]=p[0] 且p[2]=p[1]
但是模式串p显然不满足这个条件所以第二次匹配可以直接跳过
这样一来通过这次判断我们将问题转化到了p字符串本身减少了s与p的比较次数从而降低了时间复杂度而如果我们多次进行这样的判断 省去中间所有没有意义的匹配过程 那不就是对算法进行了优化吗？

kmp的实现思路

假定p串长度为m
对于通常情况来说假设某一次匹配某次匹配后，s_ts_t+1…s_t+j与p₀p₁…p_j匹配而s_t+j+1与p_j+1不等，匹配失败
通过之前的分析，我们知道此时要比较p本身如果p₀…p_j-1不等于p₁…p_j的话爆破算法的下一步匹配就可以去掉
然后继续对p串进行移位直到找到一个k 使得p₀…p_K=p_j-k…p_j 这时才满足了判断的前提同时根据已经匹配上的部分可以知道
s_t+j-k…s_t+j=p_j-k…p_j=p₀…p_k 也就是说p串的前k位已经可以匹配s串的对应位置了那么只需要对p串中剩余的其他位与s串后面的位置进行比较即可
即比较s_t+j+1…s_t+j+m-k与p_k+1…p_m是否相等
推广一下 kmp的思路即为匹配失败后通过对模式串本身进行对比计算出模式串与主串已经匹配了的k位然后从模式串的下一位开始继续进行下一次匹配
而在上面的过程中最核心的问题就是计算k的值 k值关系到匹配失败后下一次匹配的回溯位置而课本上引入了失败函数 f(i); 其含义为从p[0]到p[i]的字符串中前缀和后缀的最长重复长度-1

//举个栗子
p:    abcab
f(i): -1 -

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
KMP算法概要

前言经典空间换时间算法看了贼久才看懂网上的博客文章有很多但是基本都很复杂从头到尾说一遍我是真的没那精力和耐心因此这篇只说一下最核心的几个问题写的更多是我的思考的过程希望能对大家有帮助请结合jlu数据结构课本食用kmp这三个老家伙一个比一个顶网上的很多文章中对于失败函数的定义并不相同但是大体思路一致请注意本文f()的含义kmp算法为什么会有kmp算法？我们知道最简单的字符串匹配方法是暴力破解，即将模式串与主串从第一位开始匹配，若不成功则让模式串从主串第二位开始匹配，一直到模.
复制链接

扫一扫