题目描述
ZJM 的女朋友是一个书法家,喜欢写一些好看的英文书法。有一天 ZJM 拿到了她写的纸条,纸条上的字暗示了 ZJM 的女朋友 想给 ZJM 送生日礼物。ZJM 想知道自己收到的礼物是不是就是她送的,于是想看看自己收到的礼物在纸条中出现了多少次。
输入格式
第一行输入一个整数代表数据的组数
每组数据第一行一个字符串 P 代表 ZJM 想要的礼物, 包含英语字符 {‘A’, ‘B’, ‘C’, …, ‘Z’}, 并且字符串长度满足 1 ≤ |P| ≤ 10,000 (|P| 代表字符串 P 的长度).
接下来一行一个字符串 S 代表 ZJM 女朋友的纸条, 也包含英语字符 {‘A’, ‘B’, ‘C’, …, ‘Z’}, 满足 |P| ≤ |S| ≤ 1,000,000.
输出格式
输出一行一个整数代表 P 在 S中出现的次数.
样例输入
3
BAPC
BAPC
AZA
AZAZAZA
VERDI
AVERDXIVYERDIAN
样例输出
1
3
0
思路
KMP算法
作用
判断字符串P是否为字符串S的子串即字符串匹配问题
暴力解法
记n=len(S),m=len§,枚举i=0,1,…,n-m,将S[i,i+m]与P比较,复杂度为O(nm)
KMP优化
上述暴力算法中每次比较失败,后移一位继续比较,KMP跳过那些绝不可能成功的字符串比较,尽量减少比较的趟数。
核心:next数组
next[i]的值为使P[0…i]这个子串的K-真前缀等于K-真后缀的最大的K
每次匹配失败后,若再P[r]匹配失败,则对于P[0…r-1]这一段前next[r-1]个字符一定与后next[r-1]个字符相同,则可用长度next[r-1]的前缀替代当前比较的后缀,让P[next[r-1]]这个字符对准刚刚匹配失败的地方进行下一次匹配。
代码
#include <iostream>
#include <stdio.h>
#include <string.h>
using namespace std;
char ptr[10005];
char str[1000005];
int Next[10005];
void getnext(char*pstr,int len)
{
Next[0]=0;
for(int i=1,j=0;i<len;i++)
{
while(j&&pstr[i]!=pstr[j])j=Next[j-1];
if(pstr[i]==pstr[j])j++;
Next[i]=j;
}
}
int KMP(char*str,char*ptr)
{
int len1=strlen(str);
int len2=strlen(ptr);
int cnt=0;
getnext(ptr,len2);
for(int i=0,j=0;i<len1;i++)
{
while(j&&str[i]!=ptr[j]) j=Next[j-1];
if(str[i]==ptr[j])j++;
if(j==len2)
{
cnt++;
j=Next[j-1];
}
}
return cnt;
}
int main(int argc, char** argv) {
int T;
scanf("%d",&T);
while(T--)
{
scanf("%s",ptr);
scanf("%s",str);
int ans=KMP(str,ptr);
printf("%d\n",ans);
}
return 0;
}