看了一晚上KMP 终于弄懂了 真是吃力啊

!!!!!
我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法。KMP算法是拿来处理字符串匹配的。换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串)。比如,字符串A="I'm matrix67",字符串B="matrix",我们就说B是A的子串。你可以委婉地问你的MM:“假如你要向你喜欢的人表白的话,我的名字是你的告白语中的子串吗?” 解决这类问题,通常我们的方法是枚举从A串的什么位置起开始与B匹配,然后验证是否匹配。假如A串长度为n,B串长度为m,那么这种方法的复杂度是O (mn)的。虽然很多时候复杂度达不到mn(验证时只看头一两个字母就发现不匹配了),但我们有许多“最坏情况”,比如,A= "aaaaaaaaaaaaaaaaaaaaaaaaaab",B="aaaaaaaab"。我们将介绍的是一种最坏情况下O(n)的算法(这里假设 m<=n),即传说中的KMP算法。 之所以叫做KMP,是因为这个算法是由Knuth、Morris、Pratt三个提出来的,取了这三个人的名字的头一个字母。这时,或许你突然明白了AVL 树为什么叫AVL,或者Bellman-Ford为什么中间是一杠不是一个点。有时一个东西有七八个人研究过,那怎么命名呢?通常这个东西干脆就不用人名字命名了,免得发生争议,比如“3x+1问题”。扯远了。 个人认为KMP是最没有必要讲的东西,因为这个东西网上能找到很多资料。但网上的讲法基本上都涉及到“移动(shift)”、“Next函数”等概念,这非常容易产生误解(至少一年半前我看这些资料学习KMP时就没搞清楚)。在这里,我换一种方法来解释KMP算法
KMP算法(Knuth-Morris-Pratt算法)是一种字符串匹配算法,用于在一个文本串S中查找一个模式串P的出现位置。它的核心思想是利用已经匹配过的部分字符,尽量减少不必要的比较次数。 KMP算法的步骤是这样的: 1. 预处理模式串P,得到一个next数组。next[i]表示P[0:i]这个子串中,最长的相等前缀和后缀的长度。我们可以通过不断比较P的前缀和后缀得到这个next数组。 2. 遍历文本串S,同时遍历模式串P。当遇到不匹配的字符时,根据next数组,将模式串P向右移动尽量少的距离。移动的距离由next数组中的值决定。 3. 当P移到最右端时,如果还是没有匹配成功,则继续将P向右移动一个位置,继续匹配。 这样,通过预处理模式串P,我们能够在匹配过程中尽量少的进行字符比较,提高了算法的效率。 终于全部弄懂KMP算法,我明白了它的原理和实现过程。它的核心在于构建next数组,这个数组能够帮助我们在匹配过程中避免重复比较已经匹配过的字符。通过next数组,我们可以事先知道模式串P中的每个位置的最长相等前缀和后缀的长度,从而决定每次匹配过程中的移动距离。 KMP算法是一种高效的字符串匹配算法,它的时间复杂度为O(n+m),其中n和m分别是文本串S和模式串P的长度。相比于暴力匹配算法的时间复杂度O((n-m+1)m),KMP算法具有明显的优势。 了解KMP算法的原理和实现,对于我在日常编程中遇到的字符串匹配问题将会更加得心应手。我相信通过不断实践和总结,我能够更加熟练地运用KMP算法,解决字符串匹配相关的挑战。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值