kmp算法:
KMP算法与BF算法相比有较大的改进,消除了主串指针的回溯,使算法的效率得到了提高。KMP算法是通过分析模式串而从中提取出加速匹配的有用信息。若模式串t 中开头的k 个字符依次与t(j)的前面k个字符相同,取最大的k采用next数组表示,就这样,先把next数组求出来。
举个例子:
以目标串s=“aaaaab”,模式串t="aaab"为例:
KMP过程如下:
用i,j指针分别指向目标串s和模式串t,当目标串s和模式串t没有扫描完时,进行循环,如果j=-1或者i和j指的字符相同时,i和j分别加1,否则,i不变,j回退到
j=next[j]。循环结束,如果j超界的话,就表示匹配成功,返回匹配的第一个字符的位置,否则,匹配不成功,返回-1。
KMP算法:
以目标串s=“aaaaab”,模式串t="aaab"为例:
第一趟匹配是从i=0,j=0开始的,失配处为i=3,j=3。此时模式串t中有next[3]=2,表明t1t2=t0t1,所以s1s2=t0t1,第二趟匹配从i=3、j=2(=next[3])开始,即保持主串指针i不变,模式串t右滑1(j-next[j])个单位,让si和t(next[j])对齐比较。此时的KMP算法不是最优化的KMP算法,仍需改进。