1.字符串匹配问题
1.有一个字符串str1 = “硅硅古 尚硅谷你尚硅谷 尚硅谷你尚硅谷你尚硅你好”,和一个字符串str2 = “尚硅谷你尚硅你”
2,现在要判断str1是否包含str2,如果存在,就返回第一次出现的位置,如果没有,返回-1
2.暴力匹配算法
public class ViolenceMatch {
public static void main(String[] args) {
//测试暴力匹配算法
String str1 = "硅硅古 尚硅谷你尚硅谷 尚硅谷你尚硅谷你尚硅你好";
String str2 = "尚硅谷你尚硅你";
int index = violenceMatch(str1,str2);
System.out.println("index=" + index);
}
//暴力匹配算法实现
public static int violenceMatch(String str1, String str2){
char[] s1 = str1.toCharArray();
char[] s2 = str2.toCharArray();
int s1Len = s1.length;
int s2Len = s2.length;
int i = 0;//i索引指向s1
int j = 0;//j索引指向s2
while (i < s1Len && j < s2Len){//保证匹配时不越界
if (s1[i] == s2[j]){//匹配ok
i++;
j++;
}else {//没有匹配成功
i = i - (j - 1);
j = 0;
}
}
//判断是否匹配成功
if (j == s2Len){
return i-j;
}else {
return -1;
}
}
}
3.KMP算法
1.KMP算法是利用之前判断过信息,通过一个next数组,保存模式串中前后最长公共子序列的长度,每次回溯时,通过next数组找到前面匹配过的位置,省去了大量的计算时间。
2.思路:
有一个字符串str1 =“BBC ABCDAB ABCDABCDABDE”,和一个字符串str2 =“ABCDABD”;判断str1是否包含str2,如果存在,就返回第一次出现的位置,如果没有,返回-1
import java.util.Arrays;
public class KMPAlgorithm {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
//String str2 = "BBC";
int[] next = kmpNext("ABCDABD");//[0,1]
System.out.println("next="+ Arrays.toString(next));
int index = kmpSearch(str1, str2, next);
System.out.println("index= " +index);
}
//写出kmp搜索算法
/**
*
* @param str1 源字符串
* @param str2 子串
* @param next 部分匹配表,是子串对应的部分匹配表
* @return 如果是-1就是没有匹配到,否则返回第一个匹配的位置
*/
public static int kmpSearch(String str1, String str2, int[] next){
//遍历
for (int i=0, j=0; i< str1.length(); i++) {
//需要处理str1.charAt(i) != str2.charAt(j)
//kmp核心算法
while (j > 0 && str1.charAt(i) != str2.charAt(j)){
j= next[j-1];
}
if (str1.charAt(i) == str2.charAt(j)){
j++;
}
if (j == str2.length()){
return i-j+1;
}
}
return -1;
}
//获取到一个字符串(子串)的部分匹配值表
public static int[] kmpNext(String dest){
//创建一个next数组保存部分匹配值
int[] next = new int[dest.length()];
next[0] = 0;//如果字符串是长度为1部分匹配值就是0
for (int i=1, j=0; i< dest.length(); i++){
//当dest.charAt(i) != dest.charAt(j)时,需要从next[j-1]获取新的j
//直到发现有dest.charAt(i) == dest.charAt(j)时才退出
//kmp算法的核心
while (j > 0 && dest.charAt(i) != dest.charAt(j)){
j= next[j-1];
}
//当dest.charAt(i) == dest.charAt(j)时,部分匹配值就是+1
if (dest.charAt(i) == dest.charAt(j)){
j++;
}
next[i] = j;
}
return next;
}
}