Brute Force Match Algorithm& KMP Algorithm
暴力匹配算法(Brute Force Match Algorithm)
- 从原文字符串 str1中匹配, 子字符串 str2
- 如果当前字符匹配成功, 即 str1[i]==str2[j], 则 i++; j++; 继续匹配下一个字符
- 如果当前字符匹配失败, 则 i=i-(j-1); j=0; 也就是每次匹配失败时, i回溯, j被置为0
- 代码实现
public class BruteForceMatchApp {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
int index = bruteForceMatch(str1,str2);
System.out.println("下标为 " + index);
}
/** 暴力匹配算法*/
public static int bruteForceMatch(String str1, String str2) {
char[] s1 = str1.toCharArray();
char[] s2 = str2.toCharArray();
int s1len = s1.length;
int s2len = s2.length;
int i = 0;
int j = 0;
while (i < s1len && j < s2len) {
if (s1[i] == s2[j]) {
// 当前字符匹配成功
i++;
j++;
} else {
// 当前字符匹配失败
// 首轮 i(1) = i(0) - (j(0) - 1)
i = i - (j - 1);
j = 0;
}
}
if (j == s2len) {
return i - j;
} else {
return -1;
}
}
}
输出:
> 下标为 15
* 通过暴力匹配算法匹配字符串会发生大量的回溯, 因此匹配速度不佳. 不推荐使用
KMP算法(KMP Algorithm)
- 它常用于文本串 S内查找一 个模式串 P的出现位置. 由 Donald Knuth, Vaughan Pratt, James H. Morris三人于 1977年联合发表, 故取三人的姓氏命名
- KMP算法就是利用之前判断过的信息, 通过一个 next数组, 保存模式串中前后最长公共子序列的长度, 每次回溯时, 通过 next数组找到, 前面匹配过的位置, 省去了大量的计算时间
- 代码实现
public class KMPAlgorithmApp {
public static void main(String[] args) {
String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";
int[] next = kmpNext("ABCDABD");
System.out.println(Arrays.toString(next));
int index = kmpSearch(str1, str2, next);
System.out.println("下标为 " + index);
}
/** 部分匹配表:
* - 首先获取到长度较小的字符串的部分匹配值*/
public static int[] kmpNext(String dest) {
int[] next = new int[dest.length()];
for (int i = 1, j = 0; i < dest.length(); i++) {
while (j > 0 && dest.charAt(i) != dest.charAt(j)) {
j = next[j - 1];
}
if (dest.charAt(i) == dest.charAt(j)) {
j++;
}
next[i] = j;
}
return next;
}
/** KMP搜索算法*/
public static int kmpSearch(String str1, String str2, int[] next) {
for (int i = 0, j = 0; i < str1.length(); i++) {
while (j > 0 && str1.charAt(i) != str2.charAt(j)) {
j = next[j - 1];
}
if (str1.charAt(i) == str2.charAt(j)) {
j++;
}
if (j == str2.length()) {
return i - j + 1;
}
}
return -1;
}
}
输出:
> [0, 0, 0, 0, 1, 2, 0]
> 下标为 15
如果您觉得有帮助,欢迎点赞哦 ~ 谢谢!!