1、KMP算法是一个解决模式串在文本串是否出现过 如果出现过,最早出现的位置的经典算法
KMP算法利用之前判断过的信息,通过一个next[]的数组,保存模式串中最长公共子序列的长度
每次回溯时,通过next[]数组 省去多余的重复比较 省去了大量计算时间
2、部分匹配值:前缀、后缀的概念
例: bread 前缀:从头开始,依次增加直到剩下最后一个字符 b br bre brea
后缀:从第二个字符开始,依次往后(递减) read ead ad d
bread对应的next=[0,0,0,0,0] ABCDABD–>next=[0,0,0,0,1,2,0]
3、 移动的位数=已匹配的字符数-对应部分的匹配值
4、算法思想:先得到子串的部分匹配表,再使用部分匹配表完成KMP算法
//原始方法 一个一个地往后移动
public static int original(String str1, String str2) {
char[] c1 = str1.toCharArray();
char[] c2 = str2.toCharArray();
int res=-1;
loop:for (int i = 0; i <= c1.length - c2.length; i++) {
for (int j = 0; j < c2.length; j++) {
if (c1[i + j] != c2[j]) {
break;
}
while (j == c2.length - 1) {
res=i;
break loop;
}
}
}
return res;
}
//获取子串部分的匹配值表
public static int[] getNext(String str){
//创建一个next数组保存部分匹配值
int[] next=new int[str.length()];
next[0]=0; //单个字符的情况 部分匹配值就是0
for(int i=1,j=0;i<str.length();i++){
//KMP算法核心步骤
while(j>0 && str.charAt(i)!=str.charAt(j)){
j=next[j-1];
}
//当str.charAt(i)==str.charAt(j)满足时,部分匹配值+1
if(str.charAt(i)==str.charAt(j)){
j++;
}
next[i]=j;
}
return next;
}
//KMP算法 str1源字符串 str2子串 next子串部分匹配值表
public static int kmpSearch(String str1,String str2,int[] next){
for(int i=0,j=0;i<str1.length();i++){
//KMP算法核心步骤 不相等时改变j的值
while(j>0 && str1.charAt(i)!=str2.charAt(j)){
j=next[j-1];
}
if(str1.charAt(i)==str2.charAt(j)){
j++;
}
if(j==str2.length()){
return i-j+1;
}
}
return -1;
}
测试代码:
public static void main(String[] args) {
int[] next=getNext("ABCDAB");
out.println(Arrays.toString(next));
out.println(kmpSearch("ABCABCDABD","ABCDABD",next));
}
结果:
KMF算法核心步骤,while(j>0 && str1.charAt(i)!=str2.charAt(j)) {j=next[j-1];}
至于这个公式的原理是什么,我也不知道o(╥﹏╥)o 视频老师说可以带入具体的字符串进行验证,我一步一步带入验证了,当然结果是正确的。
对于我来说,主要掌握KMP算法的意义、next数组的存在和由来、代码可以写足矣吧。