KMP

本文深入解析了KMP算法,用于解决字符串匹配问题,通过构造next数组利用已匹配信息,将时间复杂度从O(n*m)优化到O(n+m)。通过实例和模版展示如何预处理模式串并实现高效匹配。阅读了解如何避免重复匹配,提高搜索效率。
摘要由CSDN通过智能技术生成

解决的问题

字符串匹配问题,给定一个目标匹配串,一个模式串,在目标匹配串中查找模式串,若匹配串长度n,模式串长度m,可以将时间复杂度从 O ( n ∗ m ) O(n * m) O(nm)降低到 O ( n + m ) O(n + m) O(n+m)

思想

暴力解法
枚举每一个原串,同时开始枚举模式串,一个一个匹配下去,若匹配失败,从原串下一个与模式串第一个重新开始匹配。
缺点:没利用好已经匹配的信息,当原串与模式串已经匹配了很多值时,一次匹配失败,全部从头与原串第二个进行匹配。

KMP
①匹配
就是利用好已匹配串的数据,对于匹配串每一个数都保存一个next数组,该next数组含义就是该数之前的数前缀与后缀相同的数量
例如 b c b c d f b c b
next 0 0 1 2 0 0 1 2 3
那么匹配的时候若遇到不匹配的数时,可以将 j,也就是模式串的匹配位置移到next值上,就能保证如果能匹配到的话能找到这种情况,如果next等于0了,说明无前缀等于后缀了,直接原串 位置 i 向后移一位,这种情况就是直接对原串下一位继续开始匹配。
②预处理
那么下一个问题就是如何求出next数组,暴力肯定是不行的,方法就是用匹配串来匹配自己,同样的方法,初始化第一位next[1] = 0,从第二位开始匹配,当while中第一次匹配成功时就是最长的时刻,此时 j 就是next值,若无匹配到,那么next就是0。

模版

//s1为待匹配串,s2为模式串,用s2来匹配s1
//两个串下标都是从1开始
for (int i = 2, j = 0; i <= m; i ++){	//预处理模式串
    while (j && s2[i] != s2[j + 1]) j = ne[j];
    if (s2[i] == s2[j + 1]) j ++;        
    ne[i] = j;
}
for (int i = 1, j = 0; i <= n; i ++){	//匹配
    while (j && s1[i] != s2[j + 1]) j = ne[j];	//循环找到下一位匹配的或完全不匹配
    if (s1[i] == s2[j + 1]) j ++;	//如果当前对的上,继续下一位匹配
    if (j == m){
        //匹配成功
    }
}

讲的有点乱,详细也可以这篇博客
https://www.cnblogs.com/SYCstudio/p/7194315.html

我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法。KMP算法是拿来处理字符串匹配的。换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串)。比如,字符串A="I'm matrix67",字符串B="matrix",我们就说B是A的子串。你可以委婉地问你的MM:“假如你要向你喜欢的人表白的话,我的名字是你的告白语中的子串吗?” 解决这类问题,通常我们的方法是枚举从A串的什么位置起开始与B匹配,然后验证是否匹配。假如A串长度为n,B串长度为m,那么这种方法的复杂度是O (mn)的。虽然很多时候复杂度达不到mn(验证时只看头一两个字母就发现不匹配了),但我们有许多“最坏情况”,比如,A= "aaaaaaaaaaaaaaaaaaaaaaaaaab",B="aaaaaaaab"。我们将介绍的是一种最坏情况下O(n)的算法(这里假设 m<=n),即传说中的KMP算法。 之所以叫做KMP,是因为这个算法是由Knuth、Morris、Pratt三个提出来的,取了这三个人的名字的头一个字母。这时,或许你突然明白了AVL 树为什么叫AVL,或者Bellman-Ford为什么中间是一杠不是一个点。有时一个东西有七八个人研究过,那怎么命名呢?通常这个东西干脆就不用人名字命名了,免得发生争议,比如“3x+1问题”。扯远了。 个人认为KMP是最没有必要讲的东西,因为这个东西网上能找到很多资料。但网上的讲法基本上都涉及到“移动(shift)”、“Next函数”等概念,这非常容易产生误解(至少一年半前我看这些资料学习KMP时就没搞清楚)。在这里,我换一种方法来解释KMP算法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值