kmp算法就是在主串里面快速地寻找出模式串的位置,之前的BF算法太过暴力以及会牵扯到回溯的问题大大浪费了已经匹配好的串。
先来认清理解前缀后缀以及最长公共子缀
例如串:ababca
它的前缀:a,ab,aba,abab,ababc
后缀:babca,abca,bca,ca,a
最长公共子缀就是a
例如串:abbaa
前缀:a,ab,abb,abba
后缀:bbaa,baa,aa,a
最长公共子缀就是a
例如串:abaab
前缀:a,ab,aba,abaa
后缀:baab,aab,ab,b
最长公共子缀ab
ok,然后来理解next数组吧,我还是直接告诉大家咋样算,那个发明kmp的研究生很厉害
next数组一般有三种情况:
j=1的时候 0
有公共子缀: 最长公共子缀长度+1
无公共子缀 :1
比如串:
1 2 3 4 5 6 7 8
a b a a b c a c
next[j]: 0 1 1 2 2 3 1 2
注意这里求的子串的值在[1,j-1]
就是比如next[4]其实是看[1,3]也就是aba,它的最长公共子缀是a,所以符合有公共子缀的情况,所以next[4]=a的长度也就是1再+1=2
如果你看不懂我就明讲一下:
next[1] j=1所以符合第一种情况j=1 所以为:0
next[2] a无公共子缀 符合第三种情况 所以为:1
next[3] ab无公共子缀符合第三种情况 所以为:1
next[4] aba它的最长公共子缀是a符合第二种情况 所以为2
…后面都一样
然后来说每次模式串移动的位数:
分为两种情况:
有匹配字符的时候
移动位数=已经匹配的串的长度-最后一个匹配字符的next数组的值
无匹配字符:
移动位数=1
这个是我验证过的,应该是没有问题的,我这篇也是我自己的笔记吧,只讲了kmp的原理以及next数组求法和模式串移动位数