题目描述
给出两个字符串 s_1s1 和 s_2s2,若 s_1s1 的区间 [l, r][l,r] 子串与 s_2s2 完全相同,则称 s_2s2 在 s_1s1 中出现了,其出现位置为 ll。
现在请你求出 s_2s2 在 s_1s1 中所有出现的位置。
定义一个字符串 ss 的 border 为 ss 的一个非 ss 本身的子串 tt,满足 tt 既是 ss 的前缀,又是 ss 的后缀。
对于 s_2s2,你还需要求出对于其每个前缀 s's′ 的最长 border t't′ 的长度。
输入格式
第一行为一个字符串,即为 s_1s1。
第二行为一个字符串,即为 s_2s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s_2s2 在 s_1s1 中出现的位置。
最后一行输出 |s_2|∣s2∣ 个整数,第 ii 个整数表示 s_2s2 的长度为 ii 的前缀的最长 border 长度。
输入输出样例
输入
ABABABC
ABA
输出
1
3
0 0 1
说明/提示
样例 1 解释
。
对于 s_2s2 长度为 33 的前缀 ABA,字符串 A 既是其后缀也是其前缀,且是最长的,因此最长 border 长度为 11。
数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
Subtask 1(30 points):|s_1| \leq 15∣s1∣≤15,|s_2| \leq 5∣s2∣≤5。
Subtask 2(40 points):|s_1| \leq 10^4∣s1∣≤104,|s_2| \leq 10^2∣s2∣≤102。
Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1 \leq |s_1|,|s_2| \leq 10^61≤∣s1∣,∣s2∣≤106,s_1, s_2s1,s2 中均只含大写英文字母。
代码如下:
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
char s1[1000010],s2[1000010];
int next[1000010];
int len1,len2;
void get_next()
{
int i,j;
i=0;
j=-1;
next[0]=-1;
while(i<len2)
{
if(j==-1||s2[i]==s2[j])
{
i++;
j++;
next[i]=j;
}
else
j=next[j];//若字符不相同,则k值回溯
}
}
void Index_KMP()
{
int i=0;
int j=0;
while(i<len1&&j<len2)//当i小于S的长度并且j小于T的长度
{
if(j==-1||s1[i]==s2[j])//两字母相等继续
{
i++;
j++;
}
else
{
j=next[j];//j退回合适的位置i值不变
}
if(j==len2)
{
printf("%d\n",i-len2+1);
j=next[j];
}
}
}
int main()
{
scanf("%s %s",s1,s2);
len1=strlen(s1);
len2=strlen(s2);
get_next();
Index_KMP();
for(int i=1;i<=len2;i++)
printf("%d ",next[i]);
return 0;
}