【模板】KMP
题目描述
给出两个字符串 s 1 s_1 s1 和 s 2 s_2 s2,若 s 1 s_1 s1 的区间 [ l , r ] [l, r] [l,r] 子串与 s 2 s_2 s2 完全相同,则称 s 2 s_2 s2 在
s 1 s_1 s1 中出现了,其出现位置为 l l l。 现在请你求出 s 2 s_2 s2 在 s 1 s_1 s1 中所有出现的位置。定义一个字符串 s s s 的 border 为 s s s 的一个非 s s s 本身的子串 t t t,满足 t t t 既是 s s s 的前缀,又是
s s s 的后缀。 对于 s 2 s_2 s2,你还需要求出对于其每个前缀 s ′ s' s′ 的最长 border t ′ t' t′ 的长度。输入格式
第一行为一个字符串,即为 s 1 s_1 s1。 第二行为一个字符串,即为 s 2 s_2 s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s 2 s_2 s2 在 s 1 s_1 s1 中出现的位置。 最后一行输出 ∣ s 2 ∣ |s_2| ∣s2∣
个整数,第 i i i 个整数表示 s 2 s_2 s2 的长度为 i i i 的前缀的最长 border 长度。样例 #1
样例输入 #1
ABABABC ABA
样例输出 #1
1 3 0 0 1
提示
样例 1 解释
。
对于 s 2 s_2 s2 长度为 3 3 3 的前缀ABA
,字符串A
既是其后缀也是其前缀,且是最长的,因此最长 border 长度为
1 1 1。数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
- Subtask 1(30 points): ∣ s 1 ∣ ≤ 15 |s_1| \leq 15 ∣s1∣≤15, ∣ s 2 ∣ ≤ 5 |s_2| \leq 5 ∣s2∣≤5。
- Subtask 2(40 points): ∣ s 1 ∣ ≤ 1 0 4 |s_1| \leq 10^4 ∣s1∣≤104, ∣ s 2 ∣ ≤ 1 0 2 |s_2| \leq 10^2 ∣s2∣≤102。
- Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1 ≤ ∣ s 1 ∣ , ∣ s 2 ∣ ≤ 1 0 6 1 \leq |s_1|,|s_2| \leq 10^6 1≤∣s1∣,∣s2∣≤106, s 1 , s 2 s_1, s_2 s1,s2 中均只含大写英文字母。
这道题就是妥妥的KMP模板题,具体原理可以参考知乎Pecco大佬的文章,链接贴上:https://zhuanlan.zhihu.com/p/105629613
需要注意的一点是:Pecco大佬的KMP写法与我所看到的大部分写法有细节上的不同,所以做题的时候,如果打算用Pecco大佬的码作为模板,你需要经常琢磨到底哪一点需要修改,就当是锻炼自己是否真正理解了KMP算法吧。
AC代码
#include<bits/stdc++.h>
using namespace std;
const int MAXN=1e6+10;
int pmt[MAXN];
inline void get_pmt(const string &s){
for(int i=1,j=0;i<s.length();i++){
while(j&&s[i]!=s[j])j=pmt[j-1];
if(s[i]==s[j])j++;
pmt[i]=j;
}
}
inline void kmp(const string &s,const string &p){
for(int i=0,j=0;i<s.length();i++){
while(j&&s[i]!=p[j])j=pmt[j-1];
if(s[i]==p[j])j++;
if(j==p.length()){
cout<<i-j+2<<"\n";
j=pmt[j-1];
}
}
}
int main(){
ios::sync_with_stdio(false);
string s,p;
cin>>s>>p;
get_pmt(p);
kmp(s,p);
for(int i=0;i<p.length();i++){
cout<<pmt[i]<<" ";
}
return 0;
}