题目描述
如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。
为了减少骗分的情况,接下来还要输出子串的前缀数组next。
(如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。)
输入输出格式
输入格式:第一行为一个字符串,即为s1
第二行为一个字符串,即为s2
输出格式:若干行,每行包含一个整数,表示s2在s1中出现的位置
接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值
输入输出样例
说明
时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000000
样例说明:
所以两个匹配位置为1和3,输出1、3
分析
这道题目是神秘的KMP算法构成的是一道大大的好题QAQ
所以下载让我好好分析一下;
事实上这题的效率是O(n+m)(m为模式串长度,n为匹配串长度)
首先用O(m)的时间来预处理,然后再用O(m)的时间来做最后的处理
其实kmp就是模式串先对自己的后缀进行匹配然后存储;
这样的话,做之后的kmp的匹配时,就只会对所有的字串进行一次匹配是不是不是很神奇;
接下来看代码
这道题目是神秘的KMP算法构成的是一道大大的好题QAQ
所以下载让我好好分析一下;
事实上这题的效率是O(n+m)(m为模式串长度,n为匹配串长度)
首先用O(m)的时间来预处理,然后再用O(m)的时间来做最后的处理
其实kmp就是模式串先对自己的后缀进行匹配然后存储;
这样的话,做之后的kmp的匹配时,就只会对所有的字串进行一次匹配是不是不是很神奇;
接下来看代码
#include<bits/stdc++.h>
#define N 1000005
using namespace std;
int n,m,f[N];
char T[N],P[N];
int main(){
scanf("%s%s",&T,&P);
n=strlen(T);m=strlen(P);
f[0]=f[1]=0;
for(int i=1;i<m;i++){
int j=f[i];
while(j&&P[j]!=P[i])j=f[j];
f[i+1]= P[j]==P[i] ? j+1 : 0;
}
f[m]=0;
int j=0;
for(int i=0;i<n;i++){
while(j&&P[j]!=T[i])j=f[j];
if(P[j]==T[i])j++;
if(j==m)printf("%d\n",i-m+2);
}
for(int i=1;i<=m;i++)
printf("%d ",f[i]);
return 0;
}