#1015 : KMP算法
-
5 HA HAHAHA WQN WQN ADA ADADADA BABABB BABABABABABABABABB DAD ADDAADAADDAAADAAD
样例输出
-
3 1 3 1 0
描述
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?”
小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就肯定不会这么容易的让他们回答了,于是他们只能说道:“抱歉,河蟹先生,我们只能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开判断,然后依次枚举起始位置并检查是否能够匹配,但是这不是您想要的方法是吧?”
河蟹点了点头,说道:”看来你们的水平还有待提高,这样吧,如果我说只有一个特殊文字,你能不能做到呢?“
小Ho这时候还有点晕晕乎乎的,但是小Hi很快开口道:”我知道!这就是一个很经典的模式匹配问题!可以使用KMP算法进行求解!“
河蟹满意的点了点头,对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“
”保证完成任务!”小Hi点头道。
输入
第一行一个整数N,表示测试数据组数。
接下来的N*2行,每两行表示一个测试数据。在每一个测试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。
其中N<=20
输出
对于每一个测试数据,按照它们在输入中出现的顺序输出一行Ans,表示模式串在原串中出现的次数。
这个题目我看了很久,但是看的一直都不太明白,也就是懂个大概,最后通过参考别人的代码加深了对kmp算法的理解,感觉还不错的题目;
其实这个算法就是优化了一下我们平时的暴力方法,所谓的next数组也就是模式串自己的一个性质,这个模式串的next可以通过简单的递归方式求解(实际写成循环即可)
这个next数组就是表明了当匹配不成功的时候,我保持原串的位置不变,模式串移动到他自己前面的哪个位置才可以重新开始匹配。使得复杂度降到了O(strlen(ori))
省去了原来暴力算法中不必要进行的匹配
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<algorithm>
using namespace std;
const int L = 1000005 ;
const int M = 10005 ;
char par[M];
char ori[L];
int main(){
int T;
scanf("%d",&T);
while(T--){
scanf("%s",par);
scanf("%s",ori);
int next[M];
memset(next,-1,sizeof(next));
for(int i=0,j=-1;i<strlen(par);){
if(j==-1||par[i]==par[j])next[++i]=++j;
else j=next[j];
}
int ans = 0 ;
for(int i=0,j=0;i<strlen(ori);){
if(j==-1){
i++;
j++;
}
if(ori[i]==par[j]){
if(j==strlen(par)-1){
ans++;
j=next[j] ;
}else{
i++;
j++;
}
}else{
j=next[j];
}
}
printf("%d\n",ans);
}
return 0;
}