在进行KMP查找之前先要求出目标字符串的next数组(当前位置子串的前缀子串和后缀子串的最长公共子串),然后进行KMP查找。
如图:
Java代码实现KMP算法:
package Algorithm.kmp;
import java.util.Arrays;
public class KMPAlgorithm {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
int[] next = kmpNext(str2);
System.out.println(Arrays.toString(next));
int index = kmpSerach(str1,str2,next);
System.out.println(index);
}
/**
* KMP匹配算法
* @param str1 源字符串
* @param str2 目标字符串
* @param next 目标字符串的部分匹配值表
* @return 返回-1则说明没有匹配成功,否则返回第一个匹配的位置
*/
public static int kmpSerach( String str1, String str2, int[] next ) {
for ( int i = 0, j = 0; i < str1.length(); i++ ) {
//KMP算法核心点:处理 str1.charAt(i) != str2.charAt(j)
while ( j > 0 && str1.charAt(i) != str2.charAt(j) ) {
j = next[j - 1];
}
if ( str1.charAt(i) == str2.charAt(j) ) {
j++;
}
if ( j == str2.length() ) {
return i - j + 1;
}
}
return -1;
}
/**
* 获取到一个子串的部分匹配值表
* @param dest 目标字符串
* @return 返回一个整形数组,里面的数字代表当前子串的前缀子串和后缀子串的最长公共串
*/
public static int[] kmpNext(String dest) {
//创建一个next数组来保存部分匹配值
int[] next = new int[dest.length()];
next[0] = 0;//字符串长度为1时,它的部分匹配值为0
for ( int i = 1, j = 0; i < dest.length(); i++ ) {
while ( j > 0 && dest.charAt(i) != dest.charAt(j) ) {
j = next[j - 1]; //KMP算法的核心
}
if ( dest.charAt(i) == dest.charAt(j) ) {
j++;
}
next[i] = j;
}
return next;
}
}