清晰易懂地介绍KMP算法
一个简单的假设
例子:
正文: …
模式字符串: B A A A A
其中,正文长度为N,模式字符串长度为M,一般来说N>>M。
我们先来做一个假设,假设正文中仅有A和B两个字符组成。那么如果第五个字符匹配失败,可知正文对应部分肯定为B A A A B。那么此时,我们没有必要去回退文本指针i,因为正文对应部分的第2-4个字符均为A,都和模式字符串的第一个字符B不相匹配。这时我们可以直接将i加1,以比较文本的下一字符和模式字符串中的第二个字符。这样我们最多仅仅会进行N次字符串比较。这样我们最多仅仅会进行N次字符串比较。上述情况是很特殊的,但其思想是值得思考的,那么我们可以将这种思想抽象化以使得其可以适用于所有情况吗?
暴力求解法如图所示:
可以看到,上述暴力算法中,很多指针i的移动时没有必要的。为了提升字符串匹配算法的性能,我们将介绍一个经典的且令人印象深刻