Boyer-Moore算法

tina_tian1

已于 2022-10-29 11:35:01 修改

阅读量3.4k

点赞数 1

分类专栏： Algorithm 文章标签：算法

于 2018-08-15 09:29:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tina_tian1/article/details/81698311

版权

Algorithm 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

1. 算法

KMP从前往后搜索，BM txt从前往后，匹配时从后向前，right[R]为字符R在pat出现的最右位置(base index=0).

其中Math.max(1, j-*)，是为了避免这种情况，当在pat中坏字符B的位置小于 right[B]时，避免skip出现负值。即坏字符B后还有B的情况。如下第二张图所示。

2. right[R]的构建

3. 算法最坏情况 N*M

4. 其他

以上处理为坏字符算法，另外可以结合好后缀规则一起使用，这两种算法的目的就是让模式串每次向右移动尽可能大的距离。

好后缀规则

原理

好后缀规则要更复杂一点。

假设有P和T，T中字串t匹配到了P的一个后缀，但在比较位置i时发生不匹配。设匹配到的好后缀在T中为t，在P中为t'（t = t'）。

分两种情况来讨论：

1，在P中i位置的左侧最靠近i位置查找字串t'使得t'=t（此时t'不是P的后缀，实际上也就是查找匹配到的字串除了在P的后缀中存在，是否在P的其他位置存在），若存在，则移动相应的位数将找到的t'与T中的t对齐。

2，如果t'不存在，那我们继续查找t的某一个后缀是否为P的前缀，若存在，则移动相应的位将P的前缀与t的后缀位置对齐。否则，将P向后移动n个字符。

好后缀规则的实质是，将不匹配位置右侧匹配到的字符串t的所有字符后缀组合，用于查找它们在P的不匹配位置左侧是否存在。

通俗的理解是，最长的好后缀t是否存在于i的左侧（情况1），其他后缀组合中是否存在与P的前缀相同的情况（情况2）。

图解：

情况1：模式串中有子串匹配上好后缀，此时移动模式串，让该子串和好后缀对齐即可，如果超过一个子串匹配上好后缀，则选择最靠左边的子串对齐。

情况2：模式串中没有子串匹配上后后缀，此时需要寻找模式串的一个最长前缀，并让该前缀等于好后缀的后缀，寻找到该前缀后，让该前缀和好后缀对齐即可。

情况3：模式串中没有子串匹配上后后缀，并且在模式串中找不到最长前缀，让该前缀等于好后缀的后缀。此时，直接移动模式到好后缀的下一个字符。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Boyer-Moore算法

1. 算法KMP从前往后搜索，BM txt从前往后，匹配时从后向前，right[R]为最右在pat出现的位置(base index=0).其中Math.max(1, j-*)，是为了避免这种情况，当在pat中坏字符B的位置小于 right[B]时，避免skip出现负值。即坏字符B后还有B的情况。如下第二张图所示。2.right[R]的构建3. 算法最...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。