BF算法
暴风(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种暴力算法
代码实现:
int BF(string S, string T) {
int i = 0, j = 0, k;
while (i < S.length() && j < T.length()){
if (S[i] == T[j]) {
i++;
j++;
} else {
i = i - j + 1;
j = 0;
}
}
if (j >= T.length()) {
k = i - T.length() + 1;
} else {
k = 0;
}
return k;
}
KMP算法
KMP算法:D.E.Knuth、J.H.Morris、V.R.Pratt发表的一个模式匹配算法,可以大大避免重复遍历(减少回溯)的情况,称之为克努特—莫里斯—普拉特算法,简称为KMP算法;
KMP next数组实现
next数组含义:下标为i的字符,它的前面的字符串,前后缀最长相等的长度
举例:S = “ababaabbab”
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
s | a | b | a | b | a | a | b | b | a | b |
next | -1 | 0 | 0 | 1 | 2 | 3 | 1 | 2 | 0 | 1 |
//获取next数组
void get_next(string T, int next[]) {
int i = 0, j = -1;
next[0] = -1;
while (i < T.length() - 1) {
if (j == -1 || T[i] == T[j]) {
i++;
j++;
next[i] = j;
} else {
j = next[j];
}
}
}
//KMP
int KMP(string S, string T) {
int i = 0, j = 0;
int next[10];
get_next(T, next);
while (i < (int) S.length() && j < (int) T.length()) {
if (j == -1 || S[i] == T[j]) {
i++;
j++;
} else {
j = next[j];
}
}
if (j >= T.length()) {
return i - T.length();
} else {
return 0;
}
}
踩两个坑:
1、字符串下标从0开始,所以第0位我们设置为-1(经常错)
2、string的库函数:length()是size_t类型,这里可以简单认为是unsigned int型,所以要加(int)强制转换
KMP nextval数组实现
nextval是对next的优化
nextval数组含义:如果第 i 位字符与它next值指向的 j 位字符相等,则第 i 位的nextval值就是第 j 位的nextval值,如果不等,则第 i 位的nextval值就是第 i 位的next值
举例:S = “ababaabbab”
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
s | a | b | a | b | a | a | b | b | a | b |
next | -1 | 0 | 0 | 1 | 2 | 3 | 1 | 2 | 0 | 1 |
nextval | -1 | 0 | -1 | 0 | -1 | 3 | 0 | 2 | -1 | 0 |
第一位为b,next值为0,第0位为a,b≠a,第1位的nextval就是第1位的next = 0
第二位为a,next值为0,第0位为a,a=a,第2位的nextval就是第0位的nextval = -1
第三位为b,next值为1,第1位为b,b=b,第3位的nextval就是第1位的nextval = 0
…
第九位为b,next值为1,第1位为b,b=b,第9位的nextval就是第1位的nextval = 0
void get_nextval(string T, int nextval[]) {
int i = 0, j = -1;
nextval[0] = -1;
while (i < T.length() - 1) {
if (j == -1 || T[i] == T[j]) {
i++;
j++;
if(T[i]!=T[j]){
nextval[i] = j;
}else{
nextval[i] = nextval[j];
}
} else {
j = nextval[j];
}
}
}
int KMP(string S, string T) {
int i = 0, j = 0;
int nextval[10];
get_nextval(T, nextval);
while (i < (int) S.length() && j < (int) T.length()) {
if (j == -1 || S[i] == T[j]) {
i++;
j++;
} else {
j = nextval[j];
}
}
if (j >= T.length()) {
return i - T.length();
} else {
return 0;
}
}
结语
本篇中程序都经过了多次测试,若仍有bug,请在下方评论或者联系我