引言
KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。像abcdefg与abcdg匹配时,前面四个都相同,但是最后一个不同,用传统方法还是要一个个的往后移,而kmp算法则会把无用的比较去掉,极大的优化了时间复杂度。
图解思路
普通解法
eg:主串:abcdefg 模式串:abcdg
在示例中普通的方法循环比较了整整两轮,很容易发现后面两轮第一个字符就不匹配了,所以后面两轮循环是可以去掉的,因此就用到了KMP算法。
KMP解法
观察发现,模式串本身第一个字符以后的字符都不同于第一个字符,但是与主串比较时却有四个字符相同,那么就可以知道主串的第 2~4个字符与模式串首字符不相同。连首字符都不相同,就不需要继续比较下去了。
因此比较的时候跳过这三个字符,直接从e开始比较。这里就是根据模式串本身的条件,来跳过无用的比较。
算法部分
当模式串是abcd这类没有与前缀相同的字符时,与主串有几个相同就能跳过几个;但是还有模式串像ababd,与abababd匹配时前面4个相等,如果直接跳过这4个的话就错了。
eg:模式串 ababd 主串:abababd
因为模式串中有一个子串与前缀相同,所以下一轮比较的时候这个子串也可以当作前缀
Pi标记数组
所以这里引用Pi数组,记录是否有与前缀相同的子串。
void flag() {
//pi数组初始化为0
int i = 1, j = 0;
while (i < T.length()) {
if (T[i] == T