字符串匹配,从BF 到 RK 到 KMP

 字符串匹配是一道非常经典的题目,在这里,我想写一些自己的见解,从暴力匹配到RK ,最后使用KMP。

对于主串 S 和模式串 P

i01234567891011121314151617181920
主串BBCABCDABABCDABCDABDE
模式串ABCDABD              
j0123456              

BF


首先暴力匹配就很容易理解,在主串中找到模式串的第一个字符后,主串和模式串同时往后移动一位,直到 失配 或者 匹配成功。

代码:

class Solution:
    def strStr(self, haystack: str, needle: str) -> int:
        j = 0
        for i in range(len(haystack) - len(needle) + 1):
            while j < len(needle) and haystack[i+j] == needle[j]:
                j += 1
            if j == len(needle):
                return i
            j = 0
        return -1

复杂度分析:

  • 时间复杂度:O(m*n)
  • 空间复杂度:O(1)

 

 

KMP


说KMP之前,有必要演示一遍 BF 的流程

1)


2)


在进行到 p[6] 的时候才失配,按照暴力匹配的思想,我们需要退回,使用 S[4] 去和模式串进行匹配,无疑一直到 S[7] 之前,都是不会匹配成功的,那这样的话,能不能直接跳到 S[7] 呢?

是可以的,不仅能直接跳到 s[7] ,而且还能跳到 s[9]。

也就是说,当我们失配时,我们希望主串保持不动,只是改变,主串当前位置和模式串中的另一个字符去匹配。

现在,我们的问题就变成,如何去找,该和哪一个字符进行匹配。

观察上面例子,发现,j 由 6 变成了 2,嗯嗯 2 = len('AB'),不管你信不信,这并不是一个巧合,接下来,你也可以多试一试其他的例子。

那就好办了,我们的问题现在变成了,如何找到最长公共前缀后缀,很拗口,说的简单就是

找到一个 P[K:K+N] = P[0:N]。

模式串ABCDABD
j0123456
 0000120

 

我们找到的这个东东称作 next,next的作用是,失配时,帮助我们回溯到一个正确的位置。

下面给出寻找 next 的代码。

实际上是一个 dp 的过程,

分为两种情况

  • 匹配成功时 j + 1,赋值给next[i]
  • 匹配失败时进行回溯,回溯到上一次匹配成功的地方,j = p_next[j-1]
class Solution:
    def strStr(self, haystack: str, needle: str) -> int:
        def getNext(p):
            p_next = [0] * len(p)
            j = 0
            for i in range(1,len(p)):
                while j > 0 and p[i] != p[j]:
                    j = p_next[j-1]  # 匹配失败,回到上次匹配成功的地方
                if p[i] == p[j]:
                    j += 1
                p_next[i] = j
            return p_next

 

 

 

 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
KMP算法是一种用于字符串匹配的算法,它的核心思想是利用部分匹配表来避免不必要的比较。下面是KMP算法的原理和实现步骤: 1. 部分匹配表的计算: - 部分匹配值是指字符串的前缀和后缀的最长公共部分的长度。 - 部分匹配表是一个数组,记录了每个位置的部分匹配值。 - 部分匹配表的计算可以通过动态规划的方式进行,具体步骤如下: - 初始化部分匹配表的第一个元素为0。 - 从第二个元素开始,依次计算每个位置的部分匹配值: - 如果当前位置的字符与前一个位置的部分匹配值对应的字符相等,则部分匹配值加1。 - 如果不相等,则需要回溯到前一个位置的部分匹配值对应的字符的部分匹配值,继续比较。 - 在主串中从左到右依次比较字符,同时在模式串中根据部分匹配表进行跳跃。 - 如果当前字符匹配成功,则继续比较下一个字符。 - 如果当前字符匹配失败,则根据部分匹配表找到模式串中需要跳跃的位置,继续比较。 下面是一个使用KMP算法进行字符串匹配的示例代码: ```python def kmp_search(text, pattern): n = len(text) m = len(pattern) next = get_next(pattern) i = 0 j = 0 while i < n and j < m: if j == -1 or text[i] == pattern[j]: i += 1 j += 1 else: j = next[j] if j == m: return i - j else: return -1 def get_next(pattern): m = len(pattern) next = [-1] * m i = 0 j = -1 while i < m - 1: if j == -1 or pattern[i] == pattern[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值