kmp字符串是匹配算法。利用一个next数组大大缩短每次子串对原串的遍历次数。
next数组实际保存的就是子串的自我覆盖程度。子串当前位置前有n位数与从头开始到n位数相同,这样当前位置错误判断就可以到n位匹配而不是直接从子串0位置匹配。
private int[] createNext(char[] str){
int[] next = new int[str.length];
next[0] = -1;
next[1] = 0;
int j = 0;
for (int i = 1; i < str.length - 1; i++){
j = i;
while (j > 0){
j = next[j];
if (j == -1 || str[i] == str[j]){
next[i + 1] = j + 1;
break;
}
}
}
return next;
}
next即如果子串当前位置不匹配,不用回到子串0的位置遍历,而是回到 next 数组指定的位置遍历。
private int matchByNext(char[] str, char[] matchStr, int[] next){
int i = 0;
int j = 0;
while (i < str.length && j < matchStr.length){
if (next[j] == -1 || str[i] == matchStr[j]){
i ++;
j ++;
} else {
j = next[j];
}
}
return j >= matchStr.length ? i - matchStr.length : -1;
}