KMP算法

一般字符串匹配算法

  • 也称为暴力算法,基本思想就是依次将两个字符串的每个字符进行比较,若出现不相同的字符,则终止比较,并将字符串向后移动一位,重新开始进行匹配。下面是图片解释:
    图片描述
    但我们可以发现,该方法很繁琐,效率很低,那么有什么方法可以更加便利的找到之前已经匹配好的字符串端,然后开始匹配呢?这样就可以进出我们的KMP算法了。

KMP算法中前缀表的计算

KMP算法匹配问题

前面的方法算是一种比较简单的方法,但是依旧没有用到next数组来进行计算。(谁比较成功了就是谁的next值加一)
下面我们来介绍一下next数组是如何来进行计算的吧。
首选in我们给出一组串:a b a a b c a c
next数组的求解方法是:第一位的next值为0.第二位的next值为1,后面求解每一位的next值时,都需要根据前一位进行比较。首先将前一位与其next值对应的内容进行比较(若next为1,则需要跟第一位元素来比较,即第一位元素对应的next值为1),如果相等的话,则该位的next值就是前一位的next值加一;如果不相等,则向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位置上的内容的next值对应的内容与前一位相等位置,则在这个位对应的值加上1继位需求的next值,如果找到第一位都没有找到与前一位相等的内容,那么需求的位上的next值为1.(即每次被比较的都是该位的前一位元素,而比较的则根据next值不断跳转,直至前一位元素与第一位元素相等。)
文字看起来很费解,那我们用上面给出的串来具体运算一遍。
在这里插入图片描述
1、第一位为0(固定的)
2、第二位为1(固定的)
3、在计算第三位时,看第二位b的next值,为1,则把b和1对应的a进行比较,不同,且a已经是第一位元素了,所以第三位a的next值为1.(比到了最前一位,都没有发生比较细相同的现象)
4、在计算第四位时,看第三位a的next值,为1,则把a和1对应的a进行比较,相同,则第四位啊的next值为第三位a的next值加上1,为2.(在第三位实现了其next值对应的值与第三位的值相同)
5.在计算第五位的时候,看第四位a的next值,为2,则把a和2对应的b来进行比较,不同。则再将b对应的next值1对应的a与第四位的a进行比较,相同,则第五位的next值为第二位b的next值加上1,为2.因为是在第二位实现了其next值对应的值与第四位的值相同。
6、在计算第六位的时候,看第五位的next值,为2,则把b与2对应的b来进行比较,相同,则第六位c的next值为第五位b的next值加上1.为3
7、在计算第七位的时候,看第六位c的next值,为3,则把c与3对应的a来进行比较,不同,则再把第三位a的next值1对应的a与第六位c进行比较,仍然不同,则第七位a的next值为1
8、在计算第八位的时候,看第七位a的next值,为1,则把a与1对应的a来进行比较,相同,则第八位c的next值为第七位a的next值再加上1,为2.
下面是图示,可以对照着看

KMP算法的深层原理

KMP算法的基本思路:一般情况下,当字符串匹配失败之后,我们会让模式串后移一格,之后重头再做匹配。而KMP算法则利用到了匹配失败后产生的信息(当前前缀表中显示的数字)。当匹配失败之后,KMP算法便会知晓,某个前缀不需要再次进行匹配操作(例如上述极端例子中的前缀:a a a( P[0]P[1]P[2] ))。因为它们已经是匹配好的。然后利用前缀表,让当前前缀表所指示下标数字的模式串元素与当前匹配失败位置对其,从当前位置开始,逐步往后进行匹配。(可能后面这句话有些拗口,难懂。通俗一点就是:当前位置匹配失败了,我就找现在前缀表指向的模式串元素,以它为准,与主串对齐,再从此模式串元素处开始,逐个往后匹配)
但是我们可能会考虑到,为什么前缀表具有这样的作用呢,那么我们就来跟踪一下前缀表的使用过程。

在这里插入图片描述
串A和串B是当前失配位所示(3)对应的最长公共子前后缀。当然这两个串(A、B)肯定是相同的啦(这是最大公共子前后缀嘛)。那么因为我们已经对比到了P[4],那么之前的都是匹配成功的了,那便是说,串C和串B完全相同。咦!是不是发现了什么:串A和串B是相同的,串C和串B完全相同,那么A=B=C,所以A串和C串也就匹配了呀!咦!这样我们就不需要再匹配这这串了,所以让P[3]和刚才的失配位进行对齐,再从P[3]开始,往后匹配判断就行了啊!

这就是KM算法的基本思路,在网上找了几种基本算法,感觉还是这种比较好理解一些,要是有哪些错误的话,还希望大家提出!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值