题目描述
给出两个字符串 s1 和 s2,若 s1 的区间 [l,r] 子串与 s2 完全相同,则称 s2 在 s1 中出现了,其出现位置为 l。
现在请你求出 s2 在 s1 中所有出现的位置。
定义一个字符串 s 的 border 为 s 的一个非 s 本身的子串 t,满足 t 既是 s 的前缀,又是 s 的后缀。
对于 s2,你还需要求出对于其每个前缀 s′ 的最长 border t′ 的长度。
输入格式
第一行为一个字符串,即为 s1。
第二行为一个字符串,即为 s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s2 在 s1 中出现的位置。
最后一行输出 ∣s2∣ 个整数,第 i 个整数表示 s2 的长度为 i 的前缀的最长 border 长度。
输入输出样例
输入 #1复制
ABABABC ABA
输出 #1复制
1 3 0 0 1
说明/提示
样例 1 解释
。
对于 s2 长度为 33 的前缀 ABA
,字符串 A
既是其后缀也是其前缀,且是最长的,因此最长 border 长度为 11。
数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
- Subtask 1(30 points):∣s1∣≤15,∣s2∣≤5。
- Subtask 2(40 points):∣s1∣≤104,∣s2∣≤102。
- Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1≤∣s1∣,∣s2∣≤106,s1,s2 中均只含大写英文字母。
代码如下;
#include<bits/stdc++.h>
using namespace std;
int kmp[1000000];//定义一个kmp数组
void fun1()
{
int lena,lenb,pos=0;
string a,b;
cin>>a>>b;
a='0'+a;//将字符串a与b前面加0,保证有效数据从1号位开始,0号位则被字符0填充
b='0'+b;
lena=a.size()-1;//通过size函数求输入a,b的长度
lenb=b.size()-1;
for(int i=2;i<=lenb;i++){//从b的第2位开始匹配
while(pos&&b[i]!=b[pos+1]){//如果pos存在且b[i]不等于b[pos+1],则将第pos位上的kmp值赋给pos
pos=kmp[pos];
}
if(b[i]==b[pos+1]){//如果等于,则pos进行更新pos++,且更新kmp[i]为新pos值
pos++;
kmp[i]=pos;
}
}
pos=0;//再将pos进行初始化
for(int i=1;i<=lena;i++){//从a的第1位开始匹配,并且用a与b进行比较
while(pos&&a[i]!=b[pos+1]){//同上
pos=kmp[pos];
}
if(a[i]==b[pos+1]){//同上
pos++;
}
if(pos==lenb){//如果pos值满足为b的长度,则代表a中有一段为b 的字串
printf("%d\n",i-lenb+1);//输出位置
pos=kmp[pos];//同时更新pos值
}
}
for(int i=1;i<=lenb;i++){//输出最长长度
printf("%d ",kmp[i]);
}
return;
}
int main()
{
fun1();//调用kmp函数
return 0;
}
这题就是一个典型的kmp模板题,题目也是这么写的。所以,kmp的模板就大致如上。其中最重要的就是函数中输出s2在s1中出现的一段,以及while的那一段。这两部分也是较难理解的部分,如果不理解就先记模板,最后在慢慢去看。