【算法】串的模式匹配——BF算法与KMP算法详解

第一章 序章

1.1 前言

  • KMP算法并不好理解,读者尽量选择一个完整的时间阅读本文并最好准备一张草稿纸可以自我进行适当演算笔画,能显著加快理解速度。
  • 本文尽可能直观地去描述两种模式匹配算法的规则与过程,对于算法的学习,读者应该在脑中构建一个数据结构的动态空间,在读思想的同时组织并操作这个空间中的数据。
  • 算法需要理解,需要一定的记忆,但一定不可以直接背代码或思想描述,效率很低且容易养成不爱思考的坏习惯。💪
  • 此外,一般而言看一遍就掌握KMP算法是不太可能的,不明白的时候一定要反复去看,千万别把时间浪费在找攻略上了😂。

1.2 前置约定

  • S和T是两个给定的串;
  • S称为主串
  • T称为模式串
  • 模式匹配:在串S中找到等于T的子串的过程,如果找到则匹配成功,否则匹配失败;
  • 迭代器指针:并不是语法意义上的指针,而是一个逻辑意义上的指针,语法上是一个常数变量,用于遍历串;
  • 主串匹配串:主串的某一子串,表示当前正在被匹配;
  • 前缀:一个串中一定包含第一个元素的子串;如“abc”的前缀有"a"、“ab”、“abc”;
  • 后缀:一个串中一定包含最后一个元素的子串;如"abc"的后缀有"c"、“bc”、“abc”;
  • 子模式串:模式串的一个子串;
  • 数组的0号位用于存储串长,即元素从1号位开始存

第二章 BF匹配算法

全称是Brute-Force,也称为简单匹配方法。从名字就可以看出它很简单吧😄,是一个很原始的穷举方法。

2.1 算法思路

从主串S的第一个字符开始,与模式串T中的第一个字符进行比较,若相等,则继续逐个比较后续字符;否则从主串S的第二个字符开始重新与模式串T的第一个字符进行比较。依次类推,若主串S的第i个字符开始,每个字符依次和模式串T中的对应字符相等,则匹配成功,返回i;否则,匹配失败,返回-1。

2.2 示意动画

在这里插入图片描述

看完示意动画,应该已经大致明白了一个算法的工作流程,这里主要工作有:

  • 主串和模式串迭代器指针的移动
  • 两指针所指元素的匹配比较
  • 两迭代器指针的回溯

2.3 代码

int index(sstring s, sstring t, int pos) {
   
    int i = pos, j = 1;
    while (i<=s[0]&&j<=t[0]) {
   
        if (s[i]==t[j]) {
   
            i++;
            j++;
        } else {
   
            i = i - j + 2;
            j = 1
  • 5
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
BF算法KMP算法都是模式匹配算法,但是它们的时间复杂度不同。BF算法的时间复杂度为O(m*n),其中m和n分别为主模式的长度。而KMP算法的时间复杂度为O(m+n)。因此,当模式较长时,KMP算法的效率更高。 下面是BF算法KMP算法的介绍和演示: 1. BF算法(暴力匹配算法BF算法是一种朴素的模式匹配算法,它的思想是从主的第一个字符开始,依次和模式的每个字符进行比较,如果匹配成功,则继续比较下一个字符,否则从主的下一个字符开始重新匹配BF算法的时间复杂度为O(m*n)。 下面是BF算法的Python代码演示: ```python def BF(main_str, pattern_str): m = len(main_str) n = len(pattern_str) for i in range(m-n+1): j = 0 while j < n and main_str[i+j] == pattern_str[j]: j += 1 if j == n: return i return -1 # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(BF(main_str, pattern_str)) # 输出:6 ``` 2. KMP算法(Knuth-Morris-Pratt算法KMP算法是一种改进的模式匹配算法,它的核心思想是利用已经匹配过的信息,尽量减少模式与主匹配次数。具体来说,KMP算法通过预处理模式,得到一个next数组,用于指导匹配过程中的跳转。KMP算法的时间复杂度为O(m+n)。 下面是KMP算法的Python代码演示: ```python def KMP(main_str, pattern_str): m = len(main_str) n = len(pattern_str) next = getNext(pattern_str) i = 0 j = 0 while i < m and j < n: if j == -1 or main_str[i] == pattern_str[j]: i += 1 j += 1 else: j = next[j] if j == n: return i - j else: return -1 def getNext(pattern_str): n = len(pattern_str) next = [-1] * n i = 0 j = -1 while i < n-1: if j == -1 or pattern_str[i] == pattern_str[j]: i += 1 j += 1 next[i] = j else: j = next[j] return next # 测试 main_str = 'ababcabcacbab' pattern_str = 'abcac' print(KMP(main_str, pattern_str)) # 输出:6 ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值