一.BF算法
1.原理
暴力查找
逐个匹配主串字符,然后模式串j值回溯到1重新匹配
2.代码实现
二.KMP算法
1.原理
核心是避免不必要的回溯
问题是由模式串决定,不是目标串决定
只需要将j值模式串中j的位置回溯到next[j]位,而免除了前面不需要的匹配,以此来换取时间
2.难点拆解
①前后缀
②推导next数组
利用已经部分匹配这个有效信息,保持i指针不回溯,通过修改j指针,让模式串尽量地移动到有效的位置
next数组:当模式匹配T失败时,next数组对应的元素指导应该用T串的哪个元素进行下一轮的匹配
有点像递归,自己调动自己,当前面失配的时候,j就在失配的地方回溯,因而j = next[j]
3.代码实现
4.KMP算法改进
一个例子:
主串s=“aaaaabaaaaac”
子串t=“aaaaac”
这个例子中当‘b’与‘c’不匹配时应该‘b’与’c’前一位的‘a’比,这显然是不匹配的。'c’前的’a’回溯后的字符依然是‘a’。
我们知道没有必要再将‘b’与‘a’比对了,因为回溯后的字符和原字符是相同的,原字符不匹配,回溯后的字符自然不可能匹配。但是KMP算法中依然会将‘b’与回溯到的‘a’进行比对。这就是我们可以改进的地方了。
KMP算法的改进可以简述为: 如果a位字符与它next值指向的b位字符相等,则该a位的next就指向b位的next值,如果不等,则该a位的next值就是它自己a位的next值。