字符串A B, 在A中找B
1. 对B进行预处理,B遍历长度加1的子字符串,每个子字符串取前缀和后缀相等的最大长度,构造next数组。
例如:adcadcea
子字符串:a ad adc adca adcad adcadc...
最大前后缀相同字符串:"" "" "" a ad adc
next[1...len]: 0 0 0 1 2 3 next[0]=-1
2. 与A进行匹配的时候,当匹配i位置错误时,B取next[i]位进行比较,如果依旧错误,则取next[next[i]]进行比较,这样一直操作下去,直到next值取到-1,这样操作之后就可以避免在A上每次只移动一位进行比较,把之前比较过的有相同前缀的地方直接过滤掉,从而减少的比较次数。
A: adcadccabbb
B: adcadcea
从a开始进行比较,c 和 e 不匹配,next[6]=3,B[3]=a, a!=c, next[3]=0, B[0]=a, a!=c, next[0]=-1, 匹配失败
B从头开始继续和A中c后面的字符开始比较,从而避免了A中a-c中的字符的重复比较.
具体看代码逻辑思路更加清晰:
int[] getNext(String str) {
int len = str.length();
int next[] = new int[len + 1];
int i = 0, j = next[0] = -1;
while (i < len) {
while (-1 != j && str.charAt(i) != str.charAt(j)) {
j = next[j];
}
next[++i] = ++j;
}
return next;
}
int match(String destString, String patternSting) {
int i = 0, j = 0;
int ans = 0;
int next[] = getNext(patternSting);
System.out.println(Arrays.toString(next));
int dLen = destString.length();
int pLen = patternSting.length();
while (i < dLen) {
while (-1 != j && destString.charAt(i) != patternSting.charAt(j)) {
j = next[j];
}
i++;
j++;
if (j >= pLen) {
ans++;
j = next[j];
}
}
return ans;
}