题目描述:
给出两个字符串 s1 和 s2,若 s1 的区间 [l, r] 子串与 s2 完全相同,则称 s2 在 s1 中出现了,其出现位置为 l。
现在请你求出 s2 在 s1 中所有出现的位置。
定义一个字符串 s 的 border 为 s 的一个非 s 本身的子串 t,满足 t 既是 s 的前缀,又是 s 的后缀。
对于 s2,你还需要求出对于其每个前缀 s' 的最长 border t' 的长度。
输入格式
第一行为一个字符串,即为 s1。
第二行为一个字符串,即为 s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s2 在 s1 中出现的位置。
最后一行输出 |s2| 个整数,第 i 个整数表示 s2 的长度为 i 的前缀的最长 border 长度。
本题是一个典型的kmp算法,题目中需要我们求的border数组即为next数组。
代码:
#include <bits/stdc++.h>
using namespace std;
const int N = 1e6 + 10;
string s1, s2;
int m, n, border[N];
void GetNext() {
//从零开始
int i = 0, j = -1;
border[0] = -1;
while(i < n) {
if(j == -1 || s2[i] == s2[j]) {
i++;
j++;
border[i] = j;
}
else
j = border[j];
}
}
void kmp() {
//从零开始
int i = 0, j = 0;
while(i < m && j < n){
if(j == -1 || s1[i] == s2[j]) {
i++;
j++;
}
else
j = border[j];
//若找到,则输出此时的位置,并将j赋值为 border中的值
if(j == n) {
printf("%d\n", i - n + 1);
j = border[j];
}
}
}
int main() {
cin >> s1 >> s2;
m = s1.length();
n = s2.length();
GetNext();
kmp();
for(int i = 1; i <= n; ++i)
printf("%d ", border[i]);
return 0;
}