数据结构复习--KMP算法理解(如何消除主串回溯问题)

首先明确:

  1. KMP模式匹配算法的目的是:快速在主串中匹配到子串
  2. KMP算法达到的效果是消除了主串指针的回溯,提高了字符串的匹配效率
一、BF匹配算法存在的问题

既然KMP算法是一种优化算法,那肯定原算法有不足之处。
BF算法是最基础的匹配算法,它的思想是:对于主串的每一个字符,当做子串的开头字符进行一次匹配,直到完全匹配成功

它的不足之处在于,当不完全匹配发生,再次进行匹配时可能出现主串指针回溯的现象,可以看下图的例子:

在这里插入图片描述

规定主串为S[n],子串为T[n],则有:

  • 在①中,S[0]=T[0],S[1]=T[1],S[2]≠T[2],匹配不完全,此时主串匹配指针位于S[2]处
  • 在②中,由于要从主串的第二个字符开始重新检验匹配,故主串匹配指针回溯至S[1],仍不匹配。
  • 到④时,S[3]=T[0],S[4]=T[1],S[5]=T[2],完全匹配。
二、KMP匹配算法

KMP算法能够消除主串指针的回溯,只通过移动子串来进行多次匹配。
KMP算法能够高效的发挥作用有两个前提条件:

在这里插入图片描述

在满足以上条件时,KMP算法可以在遇到不完全匹配的情况下,高效地避免主串指针回溯带来的效率损失,可以看以下例子:

在这里插入图片描述

其实简单说原理,就是:
1.假设在某处主串与子串的字符不同,但之前部分完全匹配
2.子串中存在公共的前后缀(则由1知主串中也存在),因此移动子串的实质是将子串的公共前缀,与主串的公共后缀对齐,从而避免了子串从主串S[1]、S[2]处重新判断,消除了指针的回溯.
3.那为什么可以直接将子串移动,让子串T[0]从主串S[3]开始比较?会不会遗漏掉从S[1]、S[2]处完全匹配的情况?不会。因为我们移动前选的是主串、子串公共部分最长公共前后缀

因此,当主串和子串间在存在较多“部分匹配”的前提下,KMP算法具有提高效率的作用;而当它们之间共同部分较少时,则跟BF算法的效率差异不大。

个人理解是目前这样,欢迎讨论~

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
BF算法KMP算法都是串的模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主串和模式串的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式串较长时,KMP算法的效率更高。 下面是BF算法KMP算法的介绍和演示: 1. BF算法(暴力匹配算法) BF算法是一种朴素的模式匹配算法,它的思想是从主串的第一个字符开始,依次和模式串的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主串的下一个字符开始重新匹配。BF算法的时间复杂度为O(m*n)。 下面是BF算法的Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法(Knuth-Morris-Pratt算法KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式串与主串的匹配次数。具体来说,KMP算法通过预处理模式串,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法的Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值