深入理解KMP算法

最新推荐文章于 2022-12-31 17:02:52 发布

EndlessLethe

最新推荐文章于 2022-12-31 17:02:52 发布

阅读量456

点赞数

分类专栏：算法文章标签： kmp 字符串 kmp算法算法那

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011893609/article/details/95041694

版权

写在最前面

早在大二我就想写一篇KMP的总结，主要是因为大部分blog上的文章有着各种各样的不足：有的过于冗长，有的学习曲线太陡，而《挑战》和《算法竞赛》上相关部分都因为字符串相关的内容过多，KMP算法部分不甚详尽。但是当时没有发在blog上，因为感觉从next数组谈起的话，算法的推导总会很奇怪、不顺畅。
时隔两年，花了两天时间，重新梳理了逻辑，缀字成文。

这里是我的个人网站：
https://endlesslethe.com/kmp-tutorial.html
有更多总结分享，最新更新也只会发布在我的个人网站上。
排版也可能会更好看一点=v=

KMP算法有什么用

在文本编辑中，我们经常要在一段文本（text）中找到一串我们想要的字符串（即模板，pattern）的位置。由此，便产生了字符串的匹配问题。而KMP就是为高效解决这一问题提出来的。
kmp1

事实上，KMP算法的运行速度和理解的难度都高于其他的单文本单模板匹配算法。但是KMP算法在Tier树上扩展得到的AC自动机算法，是解决单文本多模板匹配的不二法门。如果读者有志于ACM竞赛的话，KMP算法是不能不理解的基础内容。

基础定义

这里简单地定义几个基础的名词，随着推导的深入，新的名词会在文中给出定义。

文本较长，模板较短。我们在文本链上查找模板链。
文本用T表示，长度为n。模板用P表示，长度为m。
文本指针：一个指针，它在文本串上从头到尾一位一位地移动，指向文本第一个未比较的字符，用i表示。文本指针的编号从0开始。
模板指针：一个指针，它在模板链上移动，指向模板第一个未比较的字符，用j表示。模板指针的编号也从0开始。
匹配：当它作为动词时，指T[i] == P[j]（且前面若干个字符也存在T[i’] == P[j’]），这是针对一个字符而言，其与失配对应。当它作为名词时，指的是T的某个子串与P一一对应，即匹配了恰好m次，称为一个匹配。
失配：指T[i] != P[j]，虽然前面的若干个字符都匹配，但在这个字符不能匹配。
已匹配模板链：当失配发生时，前面若干个已经匹配的字符，称之为已匹配模板链。

先看一个朴素算法

我们不难由“判断两个字符串是否相等”入手，从T[0]开始向后比较len§个字符，如果相等，则找到一个匹配。如果不相等，则继续从T[1]开始比较。
这样的时间复杂度为O((N-M&#

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深入理解KMP算法

写在最前面早在大二我就想写一篇KMP的总结，主要是因为大部分blog上的文章有着各种各样的不足：有的过于冗长，有的学习曲线太陡，而《挑战》和《算法竞赛》上相关部分都因为字符串相关的内容过多，KMP算法部分不甚详尽。但是当时没有发在blog上，因为感觉从next数组谈起的话，算法的推导总会很奇怪、不顺畅。时隔两年，花了两天时间，重新梳理了逻辑，缀字成文。这里是我的个人网站：https://...
复制链接

扫一扫

专栏目录

博客等级

码龄11年

30
原创

200
点赞

794
收藏

215
粉丝

关注

私信

热门文章

分类专栏

总结 1篇
算法 12篇
java 1篇
操作系统 4篇
计算机网络 1篇
机器学习 2篇
数学 7篇

最新评论

2018美赛B题总结
koi13579246810: 大哥学弟跪求！
2018美赛B题总结
koi13579246810: 大哥学弟跪求
单调队列和单调栈详解
Apple_zone404: 讲的好好！
深入理解Bellman-Ford（SPFA）算法
努力攻坚操作系统: 写的非常好，但我觉得对于负圈的解释不够清晰，对于无向图来说，存在负边则存在负圈（因为可以在这条边上来回走从而导致距离无限减小），对于有向图来说，若有一个带负权边的环，且环上所有边的权值相加为负数，则该图存在负圈，循环走这个圈，距离会无限减小。所以对于有负圈的图，只要到目标节点之间有一条路径经过负圈，即可在负圈上无限循环从而使最短路径无限减小，即准确的讲，不存在到目标节点的最短路径。而对于带有负边但没有负圈的图，Floyd,bellman-ford,spfa算法均可求得最短路径，但是由于dijkstra算法使用了贪心思想，其认为在原有路径上若多走一条边则消耗会更大，该思想在存在负边的图中不成立，因为若多走的这条边是负边，则可使代价减小，所以dijkstra算法不能解决带负边的问题。以上仅代表个人观点与理解
深入理解Bellman-Ford（SPFA）算法
王朝1988: 语言表达能力太强了！！！第二次阅读收获很大，像楼主学习

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。