KMP算法C++代码实现

KMP算法的思路

KMP算法是由两个字符串组成,一个称之为模式串,另一个称之为文本串。就像平时我们在文章中搜索关键词一样,模式串就是我们输入的关键词,也就是我们需要查找的,而文本串就是我们阅读的文章,所以从事实出发,模式串是要远远短于文本串的。KMP算法相比与朴素算法,时间复杂度从O(nm)提升到了O(n+m)。
KMP算法相比与朴素算法,精髓就在于利用了已经匹配成功的数据,每次匹配失败后不至于从头匹配。
举例来理解:
模式串:abcab
文本串:abcacababcab

前四位匹配成功,第五位匹配失败,则将模式串移动到模式串中与失配字符相同的那一位。可以用前后缀来理解,也就是将前缀移动到相同的后缀处,根据相同的前后缀来实现快速移动。移动后如下:
模式串: abcab
文本串:abcacababcab

但有时前后缀不光只有一个字符相同,可能有多个字符。举例来理解:
模式串:abcabc
文本串:abcabdababcabc

此时前五位匹配成功,第六位匹配失败,可以观察到在匹配成功的文本串的后两位为ab,正好与模式串的前两位ab相同,那么根据前后缀移动:
模式串: abcabc
文本串:abcabdababcabc

那么此时KMP的核心就很明确了,当匹配失败时,我们要根据相同的前后缀来实现快速移动模式串。

Next数组

Next数组是用来记录匹配失败后应该跳转到哪个位置的数组,对于模式串的第一位和第二位而言,只能跳转到第一位,因为Next 是要将真前缀跳跃到与它相同的真后缀上去(通常也可以反着理解),所以当i=0 或者 i=1 时,相同的真前缀只会是 str1(0) 这一个字符,所以Next[0]=Next
[1]=0。通俗一点理解就是,你第一位或第二位都匹配不上,那你就只能从第一位从新开始匹配咯。
代码实现:

for (int i = 2, j = 0;i <= n;i++)
    {
        while (j && p[i] != p[j + 1]) {
         //判断j是否为0是因为跳回到第一个字符后就不用回跳了
            j = Next[j];
        }
        if (p[i] == p[j + 1]) {
            j++;
            Next[i] = j;
        }//通过自己匹配自己来得出每一个点的next值
    }
    cout << "Next数组:";
    for (int i = 1;i <= n;i++) {
        cout << Next[i] << ' ';
    }

KMP匹配过程(完整代码在这里,大佬直接点这里就行)

有了Next数组之后,KMP的代码就很好写了,由此可得,Next数组才是KMP算法的精髓所在
完整代码如下:

#include <iostream>
#include <string>
using namespace std;
const int N = 100000;
char p[N], s[N];
//next数组表示的是不匹配时子串下标退回的位置
//比如next[i]=j就表示在子串中p[1~j]=p[i-j+1~i]
//所以子串直接退回到j下标继续和主串进行模式匹配直到匹配成功为止
int Next[N] = { 0 };
int n, m;
int main()
{
    cin >> s + 1 >> p + 1;
    m = strlen(s + 1);
    n = strlen(p + 1);
    //求next数组的过程
    //类似于KMP匹配过程
    for (int i = 2, j = 0;i <= n;i++)
    {
        while (j && p[i] != p[j + 1]) {
         //判断j是否为0是因为跳回到第一个字符后就不用回跳了
            j = Next[j];
        }
        if (p[i] == p[j + 1]) {
            j++;
            Next[i] = j;
        }//通过自己匹配自己来得出每一个点的next值
    }
    cout << "Next数组:";
    for (int i = 1;i <= n;i++) {
        cout << Next[i] << ' ';
    }
    cout << endl;
    //KMP匹配过程
    for (int i = 1, j = 0;i <= m;i++)
    {
        while (j && s[i] != p[j + 1]) {
            j = Next[j];
        }//匹配失败后,j不断的回跳,直到可以匹配成功
        if (s[i] == p[j + 1]) {
            j++;
        }//如果匹配正确,则对应的模式串位置++
        cout << "j=" << j << endl;
        //匹配成功
        if (j == n) {
            cout <<"匹配成功的起始位置:" << i - n << endl;
            j = Next[j];
        }
    }
    return 0;
}

随便输入一个例子来看看运行结果:
模式串:aba
文本串:abababc
把j一并输出出来可以更好的理解中间的循环过程。
在这里插入图片描述

作者是大一的蒟蒻,刚学KMP算法,写此文章来记录一下,以后有新的领悟了会重新增删修改,希望各位看客大佬能提出看法意见,也希望对看的这篇文的新手有点帮助^ _ ^

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诚勤的桃某光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值