浅谈字符串匹配算法 —— BM算法

概述

BF算法在某些极端情况下,性能会退化的比较严重。

RK 算法需要用到哈希算法,设计一个可以应对各种类型字符的哈希算法则并不简单。

 

BM算法

BM(Boyer-Moore)算法是一种非常高效的字符串匹配算法,性能约是著名的KMP 算法的 3 到 4 倍。

但是BM算法的实现原理也很复杂。

 

BM算法的思想

我们把模式串和主串的匹配过程,可以看作模式串在主串中不停地往后滑动。

当遇到不匹配的字符时,BF 算法和 RK 算法的做法是,模式串往后滑动一位,然后从模式串的第一个字符开始重新匹配。

但是,上图的例子,主串中的 “c” ,在模式串中是不存在的。模式串向后滑动的时候,只要 c 与模式串有重合,肯定无法匹配。

所以,我们可以一次性把模式串往后多滑动几位,把模式串移动到 c 的后面。

 

这样就将模式串向后多滑动了几位,这样一次性往后多滑动几位,匹配的效率其实就提高了。

在什么样的情况下,可以将模式串多滑动,多滑动几位?有什么样的规律吗?

 

BM算法本质上其实就是在寻找这种规律。

借助这种规律,在模式串与主串匹配的过程中&#

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值