KMP算法
嗯,一如大多数,这个算法看的很懵逼,先贴代码吧
public static int[] next(String target){
int[] next = new int[target.length()];
next[0] = 0;
for(int i=1,j=0; i<next.length; i++){
while(j>0 && target.charAt(j) != target.charAt(i)){
j = next[j-1];
}
if(target.charAt(j) == target.charAt(i)){
j++;
}
next[i] = j;
}
return next;
}
public static int kmp(String source, String target, int[] next){
for(int i=0,j=0; i<source.length(); i++){
while(j>0 && source.charAt(i) != target.charAt(j)){
j = next[j-1];
}
if(target.charAt(j) == source.charAt(i)){
j++;
}
if(j == target.length()){
return i-j+1;
}
}
return -1;
}
贴两个我在学习过程中参考的博文,C语言
Java
在此非常感谢两位博主,有需要的可以直接跳转链接去看,C语言的那个原理讲的更多一点
由于我理解的过程非常艰辛,所以想说一些自己的理解,在这里 共勉吧
第一个问题,next()
方法是用来求target字符串的所有公共子序列的长度的,这个方法用变量j去标记,从短到长,字符串每增加一位如果存在公共子序列必然是在此前的基础上产生的所以直接取前一个next[j-1]的长度去比较,直到j=0代表没有
第二个问题,关于kmp()
方法为什么需要在while循环中不停的去从next[]中往前取值我想了很久,当j长度的字符串已经匹配成功,然后下一个字符匹配不成功时,可以直接从next[j-1]的长度去做比,因为公共子序列的特性,使它子序列的长度既可以作为开头的长度,也可以将末尾的公共子序列做起始点去比较
我的表达能力大概只能讲到这里了,如果有想讨论的道友也可以找我,就酱 吃饭去了