KMP算法最佳应用-字符串匹配问题
➢字符串匹配问题: :
1)有一个字符串str1= “BBC ABCDAB ABCDABCDABDE”,和一个子串str2=“ABCDABD”
2)现在要判断str1是否含有str2, 如果存在,就返回第一次出现的位置,如果没有,则返回-1
3)要求:使用KMP算法完成判断。不能使用简单的暴力匹配算法.
一个字符串的部分匹配值求解:
字符串的最前面的一个字符,最后的一个字符被称为前缀和后缀,如 “ABCDABD”
它的前缀为A,后缀为D,然后去掉前缀和后缀,分别统计出去掉前缀后所能组合成的字符串(不用拆分字符串),去掉后缀后的所有字符串。
最大长度表:
代码实现:
package com.kmp;
import java.util.Arrays;
/*
* kmp算法解决字符串匹配问题
* */
public class KMPAlgorithm {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
int[] next = kmpNext(str2);
System.out.println(Arrays.toString(next));
int index = kmpSearch(str1, str2, next);
System.out.println(index);
}
/**
* @param str1 原字符串
* @param str2 进行匹配的字符串
* @param next 部分匹配表
* @return 如果找到,返回第一次查找到的字符串的索引,没找到则返回-1
* */
public static int kmpSearch(String str1,String str2,int[] next){
//遍历
for (int i=0,j=0;i<str1.length();i++){
//需要处理str1.charAt(i) != str2.charAt(j)的问题,就是处理j
while (j>0 && str1.charAt(i) != str2.charAt(j)){
j = next[j-1];
}
if (str1.charAt(i) == str2.charAt(j)){
j++;
}
if (j == str2.length()){
return i - j + 1;
}
}
return -1;
}
//获取到一个字符串的部分匹配值
public static int[] kmpNext(String dest){
int[] next = new int[dest.length()];
next[0] = 0; //如果字符串长度为1,部分匹配值为0
for (int i=1,j=0;i<dest.length();i++){
//dest.charAt(i) != dest.charAt(j),我们需要从next[j-1]中获取新的j
//这是KMP算法的核心点
while(j>0 && dest.charAt(i) != dest.charAt(j)){
j = next[j-1];
}
if (dest.charAt(i) == dest.charAt(j)){
j++;
}
next[i] = j;
}
return next;
}
}