BF & KMP算法_ababaabbabnext-CSDN博客

本文链接：https://blog.csdn.net/qq_45636631/article/details/116423696

文章目录

BF算法
- 代码实现：
KMP算法
- KMP next数组实现
- KMP nextval数组实现
结语

BF算法

暴风(Brute Force)算法是普通的模式匹配算法，BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配，若相等，则继续比较S的第二个字符和 T的第二个字符；若不相等，则比较S的第二个字符和T的第一个字符，依次比较下去，直到得出最后的匹配结果。BF算法是一种暴力算法

代码实现：

int BF(string S, string T) {
    int i = 0, j = 0, k;
    while (i < S.length() && j < T.length()){
        if (S[i] == T[j]) {
            i++;
            j++;
        } else {
            i = i - j + 1;
            j = 0;
        }
    }
    if (j >= T.length()) {
        k = i - T.length() + 1;
    } else {
        k = 0;
    }
    return k;
}

KMP算法

KMP算法：D.E.Knuth、J.H.Morris、V.R.Pratt发表的一个模式匹配算法，可以大大避免重复遍历（减少回溯）的情况，称之为克努特—莫里斯—普拉特算法，简称为KMP算法；

KMP next数组实现

next数组含义：下标为i的字符，它的前面的字符串，前后缀最长相等的长度

举例：S = “ababaabbab”

下标	0	1	2	3	4	5	6	7	8	9
s	a	b	a	b	a	a	b	b	a	b
next	-1	0	0	1	2	3	1	2	0	1

//获取next数组
void get_next(string T, int next[]) {
    int i = 0, j = -1;
    next[0] = -1;
    while (i < T.length() - 1) {
        if (j == -1 || T[i] == T[j]) {
            i++;
            j++;
            next[i] = j;
        } else {
            j = next[j];
        }
    }
}
//KMP
int KMP(string S, string T) {
    int i = 0, j = 0;
    int next[10];
    get_next(T, next);
    while (i < (int) S.length() && j < (int) T.length()) {
        if (j == -1 || S[i] == T[j]) {
            i++;
            j++;
        } else {
            j = next[j];
        }
    }
    if (j >= T.length()) {
        return i - T.length();
    } else {
        return 0;
    }
}

踩两个坑：
1、字符串下标从0开始，所以第0位我们设置为-1（经常错）
2、string的库函数：length()是size_t类型，这里可以简单认为是unsigned int型，所以要加(int)强制转换

KMP nextval数组实现

nextval是对next的优化

nextval数组含义：如果第 i 位字符与它next值指向的 j 位字符相等，则第 i 位的nextval值就是第 j 位的nextval值，如果不等，则第 i 位的nextval值就是第 i 位的next值

举例：S = “ababaabbab”

下标	0	1	2	3	4	5	6	7	8	9
s	a	b	a	b	a	a	b	b	a	b
next	-1	0	0	1	2	3	1	2	0	1
nextval	-1	0	-1	0	-1	3	0	2	-1	0

第一位为b，next值为0，第0位为a，b≠a，第1位的nextval就是第1位的next = 0

第二位为a，next值为0，第0位为a，a=a，第2位的nextval就是第0位的nextval = -1

第三位为b，next值为1，第1位为b，b=b，第3位的nextval就是第1位的nextval = 0

…

第九位为b，next值为1，第1位为b，b=b，第9位的nextval就是第1位的nextval = 0

void get_nextval(string T, int nextval[]) {
    int i = 0, j = -1;
    nextval[0] = -1;
    while (i < T.length() - 1) {
        if (j == -1 || T[i] == T[j]) {
            i++;
            j++;
            if(T[i]!=T[j]){
                nextval[i] = j;
            }else{
                nextval[i] = nextval[j];
            }
        } else {
            j = nextval[j];
        }
    }
}

int KMP(string S, string T) {
    int i = 0, j = 0;
    int nextval[10];
    get_nextval(T, nextval);
    while (i < (int) S.length() && j < (int) T.length()) {
        if (j == -1 || S[i] == T[j]) {
            i++;
            j++;

        } else {
            j = nextval[j];
        }
    }
    if (j >= T.length()) {
        return i - T.length();
    } else {
        return 0;
    }
}