串（KMP算法）

最新推荐文章于 2024-08-13 23:31:35 发布

RainWorking

最新推荐文章于 2024-08-13 23:31:35 发布

阅读量219

点赞数

本文链接：https://blog.csdn.net/a1896578/article/details/124533794

版权

文章目录

一、串的模式匹配
二、代码
- 1.bf算法（暴力破解）
- 2.KMP算法
总结

前言：kmp算法其实并不复杂，但对于刚接触的人来说，还是有些绕弯子的。对next[]数组建立有疑问的同学，可以看这篇文章——https://www.cnblogs.com/dusf/p/kmp.html

一、串的模式匹配

bf(暴力匹配算法):最坏时间复杂度O(mn)
KMP算法：时间复杂度O(m+n)

二、代码

1.bf算法（暴力破解）

代码如下（示例）：

int bfIndex(sqString text, sqString pat)
{
    int i = 0, j = 0;
    while (i < text.length && j < pat.length)
    {
        if (text.data[i] == pat.data[j])
        {
            i++;
            j++;
        }
        else
        {
            i = i - j + 1;
            j = 0;
        }
    }
    if (j == pat.length)
        return i - j;
    return 0;
}

代码比较简单我就不啰嗦了

2.KMP算法

代码如下（示例）：

void getNext(sqString sq, int next[]) //建立next[]数组
{
    int j = 0, k = -1;
    next[0] = -1;
    while (j < sq.length - 1)
    {

        if (k == -1 || sq.data[k] == sq.data[j])
        {
            /* next[++j] = ++k; */   //这行是没有优化过的算法
            
            //加上if和else对next数组进行优化，当两个字符相等时要跳过
            if (sq.data[++j] == sq.data[++k]) 
                next[j] = next[k];  //next[j] = k，表示当!=时，j指针的下一个位置
            else
                next[j] = k;
        }
        else
        {
            k = next[k]; //这句代码简单解释就是，如果不相等后，找出最长重复子串
        }
    }
}

void KmpIndex(sqString text, sqString pat)
{
    int next[MaxSize];
    getNext(pat, next);
    int i = 0, j = 0;
    for (int n = 0; n < pat.length; n++)
        cout << pat.data[n] << ":" << next[n] << endl;
    while (i < text.length && j < pat.length)
    {
        if (j == -1 || text.data[i] == pat.data[j])
        {
            i++;
            j++;
        }
        else
        {
            j = next[j]; //与bf算法不一样的只有这句，即“!=”后j指针指向的位置
        }
    }
    if (j == pat.length)
        cout << i - j << endl;
    else
        cout << "false" << endl;
}

总结

注意，本篇代码next[0]=-1，还可以将next[0]赋值为0，这样得到的next数组所有对应的部分匹配值都要加1。同时优化后的next为nextval，他的作用是当有两个相同的字符时跳过，例如子串为ababbd，对应的next数组为 next[0]=-1,next[1]=0,next[2]=-1,ext[3]=0,next[4]=2,next[5]=0。
详细解释可以看我推荐的文章。