Boyer-Moore字符串搜索算法是一种非常高效的字符串搜索算法。它由Bob Boyer和J Strother Moore设计于1977年。此算法仅对搜索目标字符串(关键字)进行预处理,而非被搜索的字符串。不同于朴素模式(brute-force search)的逐个字符对比,它不需要对被搜索的字符串中的字符进行逐一比较,而会跳过其中某些部分。
这里使用图说明下,BM算法是怎么跳过某些字符的。假设我们要在text表示的字符串中搜索pattern表示的字符串。这里使用了原论文的一个字符串例子。
BM算法首先需要text串与pattern串左侧对齐,然后是从pattern的最右侧的字符开始,指针是从右向左移动,依次与text串中字符匹配。