(hiho一下第三周)#1015 KMP算法 【模版】

题目1 : KMP算法

时间限制: 1000ms
单点时限: 1000ms
内存限制: 256MB

描述

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?

小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就肯定不会这么容易的让他们回答了,于是他们只能说道:“抱歉,河蟹先生,我们只能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开判断,然后依次枚举起始位置并检查是否能够匹配,但是这不是您想要的方法是吧?”

河蟹点了点头,说道:”看来你们的水平还有待提高,这样吧,如果我说只有一个特殊文字,你能不能做到呢?“

小Ho这时候还有点晕晕乎乎的,但是小Hi很快开口道:”我知道!这就是一个很经典的模式匹配问题!可以使用KMP算法进行求解!“

河蟹满意的点了点头,对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“

”保证完成任务!”小Hi点头道。

提示一:KMP的思路

提示二:NEXT数组的使用

提示三:如何求解NEXT数组

输入

第一行一个整数N,表示测试数据组数。

接下来的N*2行,每两行表示一个测试数据。在每一个测试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。

其中N<=20

输出

对于每一个测试数据,按照它们在输入中出现的顺序输出一行Ans,表示模式串在原串中出现的次数。

样例输入
5
HA
HAHAHA
WQN
WQN
ADA
ADADADA
BABABB
BABABABABABABABABB
DAD
ADDAADAADDAAADAAD
样例输出
3
1
3
1
0

请学习KMP算法的各位,拿出笔和纸手动模拟一下上述提示的过程,理解里面的变化。

下面贴出Doge的加强注释代码:

#include <bits/stdc++.h>

using namespace std;

const int MAXN=1000010;   //原串的最大长度
const int MAXM=10010;     //模式串的最大长度
int Next[MAXM];           //与模式串对应的next数组
char ori[MAXN];
char par[MAXM];

/*
 * 对模式串par预处理得到next数组,将par自身作为ori串匹配
 * 由于是递归获得,所以可以从第一个就开始这样处理
 * 不难理解,next[0]是一定为-1的,next[1]是一定为0的
 */
void preKMP(char par[],int Next[])   //这一步骤请参考提示三理解
{
    int p=0,q=-1,m=strlen(par);      //p表示ori处理位置,q表示par处理位置
    Next[0]=-1;
    while(p<m)                       //注意这个过程原串(p)是逐个处理,而q有移动
    {
        while(q!=-1 && par[q]!=par[p]) q=Next[q];
        /*后面的par其实是当作ori来对待匹配
          par向右移动,直到再次匹配(par[q]==par[p])或者无法匹配(q==-1)*/

        Next[++p]=++q;               //如提示三,我们找到了一个新next元素值

        /* 改进 Next[++p]=++q;后:
        if(par[++p]==par[++q]) Next[p]=Next[q];
        else Next[p]=q;
        *其实就是加了一个if,表示如果下一个字符如果还能匹配上,
        *继续匹配直到 q=-1 || par[q]==par[p],加快预处理速度
        *公式描述 Next'[p]=Next[Next[...[Next[i]]]]
        */
    }
}

/*
 *对模式串par和原始串ori进行匹配,统计par出现次数(可重叠)
 *这个处理和上面的处理大同小异,可以互相对比理解
 */
 int countKMP(char par[],char ori[])    //这一步骤请参考提示二理解
 {
     int p=0,q=0,ans=0;          //注意了,par也是从q=0开始匹配
     int m=strlen(ori);
     int len=strlen(par);
     preKMP(par,Next);
     while(p<m)
     {
          while(q!=-1 && par[q]!=ori[p]) q=Next[q];
          p++;q++;
          if(q>=len)           //整个模式串都可以匹配上
          {
              ans++;
              q=Next[q];
          }
     }
     return ans;
 }

int main()
{
    int t;
    for(scanf("%d",&t);t;t--)
    {
        scanf("%s",par);
        scanf("%s",ori);
        printf("%d\n",countKMP(par,ori));
    }
    return 0;
}


针对这题轻微压行后的KMP模版:

#include <bits/stdc++.h>

using namespace std;

const int MAXN=1000010;
const int MAXM=10010;
int Next[MAXM];
char ori[MAXN];
char par[MAXM];

void preKMP(char par[],int Next[]){
    int p=0,q=-1,m=strlen(par);Next[0]=-1;
    while(p<m){
        while(q!=-1 && par[q]!=par[p]) q=Next[q];
        if(par[++p]==par[++q]) Next[p]=Next[q];
        else Next[p]=q;
    }
}

 int countKMP(char par[],char ori[])  {
     int p=0,q=0,ans=0;
     int m=strlen(ori);
     int len=strlen(par);
     preKMP(par,Next);
     while(p<m){
          while(q!=-1 && par[q]!=ori[p]) q=Next[q];
          p++;q++; if(q>=len){ans++; q=Next[q];}
     }
     return ans;
 }

int main()
{
    int t;
    for(scanf("%d",&t);t;t--)
    {
        scanf("%s",par);
        scanf("%s",ori);
        printf("%d\n",countKMP(par,ori));
    }
    return 0;
}

预处理改进(不用m变量)后的模版:

void preKMP() {  
    int i=0, j=-1; nex[0] = -1;  
    while(str[i]){  
        if(j == -1 || str[i] == str[j])  
            nex[++i] = ++j;  
        else j = nex[j];  
    }  
}  



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值