概述
BF算法在某些极端情况下,性能会退化的比较严重。
RK 算法需要用到哈希算法,设计一个可以应对各种类型字符的哈希算法则并不简单。
BM算法
BM(Boyer-Moore)算法是一种非常高效的字符串匹配算法,性能约是著名的KMP 算法的 3 到 4 倍。
但是BM算法的实现原理也很复杂。
BM算法的思想
我们把模式串和主串的匹配过程,可以看作模式串在主串中不停地往后滑动。
当遇到不匹配的字符时,BF 算法和 RK 算法的做法是,模式串往后滑动一位,然后从模式串的第一个字符开始重新匹配。
但是,上图的例子,主串中的 “c” ,在模式串中是不存在的。模式串向后滑动的时候,只要 c 与模式串有重合,肯定无法匹配。
所以,我们可以一次性把模式串往后多滑动几位,把模式串移动到 c 的后面。
这样就将模式串向后多滑动了几位,这样一次性往后多滑动几位,匹配的效率其实就提高了。
在什么样的情况下,可以将模式串多滑动,多滑动几位?有什么样的规律吗?
BM算法本质上其实就是在寻找这种规律。
借助这种规律,在模式串与主串匹配的过程中&#