今天又学了一下kmp
【模板】KMP字符串匹配
题目描述
给出两个字符串 s_1s1 和 s_2s2,若 s_1s1 的区间 [l, r][l,r] 子串与 s_2s2 完全相同,则称 s_2s2 在 s_1s1 中出现了,其出现位置为 ll。
现在请你求出 s_2s2 在 s_1s1 中所有出现的位置。
定义一个字符串 ss 的 border 为 ss 的一个非 ss 本身的子串 tt,满足 tt 既是 ss 的前缀,又是 ss 的后缀。
对于 s_2s2,你还需要求出对于其每个前缀 s's′ 的最长 border t't′ 的长度。
输入格式
第一行为一个字符串,即为 s_1s1。
第二行为一个字符串,即为 s_2s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s_2s2 在 s_1s1 中出现的位置。
最后一行输出 |s_2|∣s2∣ 个整数,第 ii 个整数表示 s_2s2 的长度为 ii 的前缀的最长 border 长度。
输入输出样例
输入 #1复制
ABABABC
ABA
输出 #1复制
1
3
0 0 1
说明/提示
样例 1 解释
。
对于 s_2s2 长度为 33 的前缀 ABA,字符串 A 既是其后缀也是其前缀,且是最长的,因此最长 border 长度为 11。
数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
Subtask 1(30 points):|s_1| \leq 15∣s1∣≤15,|s_2| \leq 5∣s2∣≤5。
Subtask 2(40 points):|s_1| \leq 10^4∣s1∣≤104,|s_2| \leq 10^2∣s2∣≤102。
Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1 \leq |s_1|,|s_2| \leq 10^61≤∣s1∣,∣s2∣≤106,s_1, s_2s1,s2 中均只含大写英文字母。
思路:由于是模板题,自然要用到kmp来解决。先根据子串建立next数组,存放数为前缀和+1,使每次配对失败后字串回退到最大前后缀位置,确保主串是单方向移动,时间复杂度是
o(m+n)。当子串匹配完成输出串首位置,完成匹配后输出对应next数组,由于建立时是前缀和+1,故输出时-1.
#include<bits/stdc++.h>
using namespace std;
char s1[1000005],s2[1000005];
int a[1000005];
int str1,str2;
void getnext(char s[],int length,int next[])
{
next[1]=0;
int i=1,j=0;
while (i<=length)
{
if(j==0||s[i]==s[j])next[++i]=++j;
else j=next[j];
}
}
int main()
{
scanf("%s%s",s1+1,s2+1);
str1=strlen(s1+1);
str2=strlen(s2+1);
getnext(s2,str2,a);
int q=1,l=1;
while(q<=str1){
if(s1[q]==s2[l]||l==0){q++;l++;}
else l=a[l];
if(l>str2){printf("%d\n",q-str2);l=a[l];}
}
for(int i=2;i<=str2+1;i++)printf("%d ",a[i]-1);
}