【模板】KMP 字符串匹配

【模板】 KMP字符串匹配 

作者 李廷元

单位 中国民用航空飞行学院

给出两个字符串text和pattern,其中pattern为text的子串,求出pattern在text中所有出现的位置

为了减少骗分的情况,接下来还要输出子串的前缀数组next

输入格式:

第一行为一个字符串,即为text。

第二行为一个字符串,即为pattern。

输出格式:

若干行,每行包含一个整数,表示pattern在text中出现的位置。

接下来1行,包括length(pattern)个整数,表示前缀数组next[i]的值,数据间以一个空格分隔,行尾无多余空格。

输入样例:

ABABABC
ABA

输出样例:

1
3
0 0 1

样例说明:

snap650.jpg

重要概念

  • 前缀:除去末尾字符的子串
  • 后缀:除去首位字符的子串
  • * 比如在ababa中,前缀集是{a,ab,aba,abab},后缀集是{a,ba,aba,baba},二者最长重复子串是aba
  • next数组定义:当前主串和模式串字符不匹配时,模式串要回退的位置

关于next数组,网上有两种比较常见的形式:一种是从0开始,一种是从-1开始。

两种实现代码如下:(列表模式串都以 aabaac 为例)


当p[ i ]和p[ j ]不匹配,j 回到 j - 1 对应的nxt数组值,直至匹配

cin>>t;
cin>>p;
int n=strlen(t);
int m=strlen(p);
nxt[0]=0;
for(int i=1,j=0;i<m;i++)
{
    while(j&&p[i]!=p[j]) j=nxt[j-1];
    if(p[i]==p[j]) j++;
    nxt[i]=j;
}
下标012345
  paabaac
 nxt010120

当p [ i ] 和p[ j ]不匹配,j 回到 j 对应的nxt数组值,直至匹配

cin>>t;
cin>>p;
int n=strlen(t);
int m=strlen(p);
int j=-1;
nxt[0]=j;
for(int i=1;i<m;i++)
{
    while(j>=0&&p[i]!=p[j+1]) j=nxt[j];  //需要注意这里j>=0
    if(p[i]==p[j+1]) j++;
    nxt[i]=j;
}
下标012345
  paabaac
 nxt-10-101-1

但是一般要求给出的 nxt 数组都是上述第一种。

完整版代码 (常见版)

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;

const int N = 1e6+10;
char p[N],t[N];
int nxt[N];

int main()
{
    cin>>t;
    cin>>p;
    int n=strlen(t);
    int m=strlen(p);
    nxt[0]=0;
    for(int i=1,j=0;i<m;i++)
    {
        while(j&&p[i]!=p[j]) j=nxt[j-1];  //注意是while而非if
        if(p[i]==p[j]) j++;              //因为若不匹配j要一直回退
        nxt[i]=j;
    }
    
    for(int i=0,j=0;i<n;i++)
    {
        while(j&&t[i]!=p[j]) j=nxt[j-1];
        if(t[i]==p[j]) j++;
        if(j==m)
        {
            cout<<i-m+2<<endl;  //位置:i当前位置 - m(p长度)+1(i还未到后一个位置)
            j=nxt[j-1];                    // +1(题目位置从1开始)
        }
         //为什么这里j回到nxt[j-1]? 可以代入t:zyzyzyz  p:zyz
    }

    cout<<nxt[0];
    for(int i=1;i<m;i++) cout<<" "<<nxt[i];
    return 0;
}

(此外,有将string下标从1开始,理解原理后差别不大。)

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值