Knuth-Morris-Pratt算法的Python实现

90 篇文章 9 订阅 ¥59.90 ¥99.00

Knuth-Morris-Pratt算法的Python实现

Knuth-Morris-Pratt(KMP)算法是一种用于在字符串中查找模式的高效算法。它利用了已经匹配的部分信息,避免了不必要的回溯,从而提高了匹配的效率。在本文中,我们将详细介绍KMP算法的原理,并给出其Python实现。

KMP算法的原理

KMP算法的核心思想是利用模式字符串自身的信息来避免在主字符串中进行不必要的回溯。算法通过预处理模式字符串,构建一个用于指导匹配过程的辅助数组(通常称为next数组或失配数组)。next数组记录了在每个位置上,模式字符串中出现失配时应该跳转到的下一个位置。

下面是KMP算法的主要步骤:

  1. 预处理模式字符串,构建next数组。

    • 初始化两个指针i和j,分别指向模式字符串的第一个字符和第二个字符。
    • 如果模式字符串中i位置的字符和j位置的字符相等,则将next[i+1]的值设为j+1,并同时递增i和j。
    • 如果模式字符串中i位置的字符和j位置的字符不相等:
      • 如果j等于0,则将next[i+1]的值设为0,并递增i。
      • 如果j大于0,则将j更新为next[j],然后继续比较模式字符串中i位置的字符和j位置的字符。
  2. 在主字符串中进行匹配。

    • 初始化两个指针i和j,分别指向主字符串和模式字符串的第一个字符。
    • 如果主字符串中i位置的字符和模式字符串中j位置的字符相等,则同时递增i和j。
    • 如果模式字符串中j的值等于模式字符串的长度,则表示找到了匹配,并返回匹配的起始
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BF算法和KMP算法都是串的模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式串较长时,KMP算法的效率更高。 下面是BF算法和KMP算法的介绍和演示: 1. BF算法(暴力匹配算法) BF算法是一种朴素的模式匹配算法,它的思想是从主串的第一个字符开始,依次和模式串的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主串的下一个字符开始重新匹配。BF算法的时间复杂度为O(m*n)。 下面是BF算法Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法Knuth-Morris-Pratt算法) KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式串与主串的匹配次数。具体来说,KMP算法通过预处理模式串,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值