KMP 算法

1、KMP算法

KMP 就是三位创造者的名字缩写 Knuth,Morris和Pratt

KMP 是为了解决字符串匹配的问题,极大的提高的搜索的效率。通俗来讲也就是 在一个串中查找是否出现过另一个串

KMP 算法的时间复杂度是O(n+m), 对比暴力解法时间复杂度是 O(m*n), 其中m n 是文本串与模式串的长度

KMP 经典思想就是: 当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。


讲解过程中使用的例子:

  • 文本串: aabaabaaf

  • 模式串: aabaaf

  • 求文本串与模式串完全匹配的子串

KMP算法要使用前缀表来解决问题。


1、那么什么是前缀表?

1、什么是前缀?以模式串举例。
概念:包含首字母,不包含尾字母的所有子串。

  • a
  • aa
  • aab
  • aaba
  • aabaa

2、什么是后缀
概念:包含尾字母,不包含首字母的所有子串。

  • f
  • af
  • aaf
  • baaf
  • abaaf

3、前缀表的含义是什么呢?
前缀表里的数值代表着就是:当前位置之前的子串有多大长度相同的前缀后缀。

4、前缀表有什么作用呢?
前缀表是用来回溯的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。

2、什么是最长相等前后缀?

也有人称之为求最长公共前后缀
以模式串举例,n=6,注意这个就需要一个一个来分析了。
逐个来分析前k(范围1-n)个字符组成的子串的前缀表和后缀表,求其中前缀表和后缀表中最长相等子串,
由此即可得到前缀表为:

aabaaf
010120

  • 对于 a 的最长相等前后缀长度为:0
    既没有前缀,也没有后缀,首字母即尾字母,所以为 0

  • 对于 aa 的最长相等前后缀长度为:1
    前缀为a,后缀为a,因此为1,

  • 对于 aab 的最长相等前后缀长度为:0
    因为最后是b,所以找不到与其相等的前后缀,为 0

  • 对于 aaba 的最长相等前后缀长度为:1
    因为只有第一个a与最后一个a做后缀,故为1,

  • 对于 aabaa 的最长相等前后缀长度为:2
    前缀表中的前两个aa,与后缀表中的后两个aa相等,故长度为2

  • 对于 aabaaf 的最长相等前后缀长度为:0
    显然为0。

3、如何匹配?

由上一步得到前缀

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值