字符串匹配基础(中):如何实现文本编辑器中的查找功能

本文深入解析BM(Boyer-Moore)算法,介绍如何利用坏字符规则和好后缀规则实现在文本编辑器中的查找功能。通过对坏字符规则和好后缀规则的详细分析,阐述如何在模式串与主串不匹配时计算模式串的滑动位数,以提高字符串匹配效率。
摘要由CSDN通过智能技术生成

字符串匹配基础(中):如何实现文本编辑器中的查找功能

就是word中把一个单词统一替换成另一个,可以用BM算法

BM算法的核心思想

模式串和主串匹配过程中,因为主串中的c在模式串中是没有的,所以模式从向后滑动的时候,只要c与模式串有重合,肯定无法匹配,可以一次性把模式串往后滑动几位,把模式串移动到c的后面

BM算法原理分析

BM算法包含两部分,是坏字符规则和好后缀规则

1.坏字符规则

按照模式串的下标从大到小的顺序,倒序匹配

从模式串的末尾往前倒着匹配,当我们发现某个字符串没法匹配的时候,把这个没有匹配的字符叫做坏字符(主串中的字符)我们把坏字符c在模式串中查找,发现模式串中并没有这个字符,这时候我们可以将模式串直接往后滑动三位(因为模式串只有3位),将模式串滑动到c后面的位置,再从模式串的末尾字符开始比较

这时候坏字符是a,不能往后滑动三位了,将模式串往后滑动2位,让两个a上下对齐,然后再从模式串的末尾字符开始,重新匹配

发生不匹配的时候,把坏字符对应的模式串中的字符下标记作si,如果坏字符在模式串中存在,把这个坏字符在模式串种的下标记作xi,如果不存在,xi = -1,那么模式串往后移动的位数就是si - xi (这里的下标是字符在模式串的下标)

a b c a c a b d c

​ a b d

​ 此时a就是坏字符,d就是坏字符对应的模式串中的字符下标,d = si = 2,a = xi = 0

如果坏字符在模式串里多处出现,计算xi的时候选择最靠后的那一个

单纯使用坏字符规则还不够,还需要用到“好后缀规则”

2.好后缀规则

当模式串滑动到下面位置的时候,模式串和主串有两个字符是匹配的,倒数第三个是坏字符

a b c a c a b c b c b a c a b c

​ a b b c a b c

​ a是坏字符,b c是好后缀

我们可以利用坏字符规则来计算模式串的滑动位数,也可以使用好后缀处理规则

好后缀是把已经匹配的bc叫做好后缀,记作{u},拿bc在模式串中寻找,如果找到了<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值