KMP算法回顾

kmp算法,就是对暴力匹配字符串算法的优化。

首先要了解一下前缀和后缀的匹配过程(借自文章)AcWing 831. KMP字符串 - AcWing

3、“非平凡前缀”:指除了最后一个字符以外,一个字符串的全部头部组合。
4、“非平凡后缀”:指除了第一个字符以外,一个字符串的全部尾部组合。(后面会有例子,均简称为前/后缀)

next数组的含义及手动模拟(具体求法和代码在后面)
​ 然后来说明一下next数组的含义:对next[ j ] ,是p[ 1, j ]串中前缀和后缀相同的最大长度(部分匹配值),即 p[ 1, next[ j ] ] = p[ j - next[ j ] + 1, j ]。

如:

手动模拟求next数组:

对 p = “abcab”

p    a    b    c    a    b
下标    1    2    3    4    5
next[ ]    0    0    0    1    2
对next[ 1 ] :前缀 = 空集—————后缀 = 空集—————next[ 1 ] = 0;

对next[ 2 ] :前缀 = { a }—————后缀 = { b }—————next[ 2 ] = 0;

对next[ 3 ] :前缀 = { a , ab }—————后缀 = { c , bc}—————next[ 3 ] = 0;

对next[ 4 ] :前缀 = { a , ab , abc }—————后缀 = { a . ca , bca }—————next[ 4 ] = 1;

对next[ 5 ] :前缀 = { a , ab , abc , abca }————后缀 = { b , ab , cab , bcab}————next[ 5 ] = 2;

所以,ne数组就是用来储存对应下标下一步应该移动到哪。

#include <iostream>

using namespace std;

const int N = 100010, M = 1000010;
//由于元素的重合性,kmp避免了大部分的比较,所以每次比较从i和j+1开始比较即可(即j+1指向下一个需要比较的数)。
int n,m;
int ne[N];
char s[M],p[N];
//我们规定用j+1与i进行比较,也就是说 j-1 与i-1是匹配的,也就是说j是记录最大匹配下标的位置。

//用j=0的好处是 可以直观的反应匹配的下标。
int main()
{
    cin>>n>>p+1>>m>>s+1;
    for(int i=2,j=0;i<=n;i++)
    {
        while(j&&p[j+1]!=p[i])j=ne[j];
        if(p[j+1]==p[i]) j++;
        ne[i]=j;//可以直观的返回坐标
    }
//默认 i=1时是0,如果写i=1的话,会tle,因为 ne[1]=1 会陷入死循环;
 for(int i=1,j=0;i<=m;i++)
    {
        while(j&&p[j+1]!=s[i]) j=ne[j];
        if(p[j+1]==s[i]) j++;
        if(j==n)
        {
            cout<<i-n<<" ";
            j=ne[j];
        }
    }


    return 0;
}

个人理解:创造next函数时之所以j从0开始,是因为如果一直回溯却没有匹配时返回的长度是0,那么j+1就重新从第一个开始与i进行匹配。

深究其过程不难发现,其实kmp就是由于新状态的改变,导致要对原有值不断产生更新,而由于每次只前进以为,因此只需要比较下一个数就可以得出答案了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值