KMP算法
预备知识:
前缀表(next数组) 建议先了解前缀表概念了解后再阅读本文
文本串(被匹配的长串)
模式串(子串)
失配(在文本串与模式串匹配的过程中,不匹配的那个字符位置)
1.什么是KMP算法:
通过前缀表的预处理,加速模式串移动的速度,达到时间复杂度的缩减.
2.KMP算法的由来:
关于字符串匹配这一方面,首先我们能想到的方法也就是最简单的方法就是暴力匹配,但是暴力匹配这一算法的时间复杂度非常高,达到了N的平方阶,那我们很容易想到怎么使模式串的移动加速呢?第一个想法是我们将模式串直接移动到失配位置,这样我们能大幅度的增速,但是很可惜,这个方法是错误的. 下面举例说明:
如图,我们有一个文本串需要匹配一个模式串:
显然如果我们使用暴力匹配,肯定时间复杂度是不过关的.
如果我们在每次失配的位置,直接将字符串进行整体移动,则会出现以下情况:
没错,我们错过了一次正确的匹配,所以这种方法显然是行不通的.
因此,我们知道了缩短时间复杂度的最大问题,什么问题?
如何在不错过正确匹配的前提条件下加速模式串的移动!
3.KMP算法为什么能加速:
我们知道KMP算法最重要的部分就是前缀表的计算:
也就是计算模式串的