【模板】KMP
题目描述
给出两个字符串
s
1
s_1
s1 和
s
2
s_2
s2,若
s
1
s_1
s1 的区间
[
l
,
r
]
[l, r]
[l,r] 子串与
s
2
s_2
s2 完全相同,则称
s
2
s_2
s2 在
s
1
s_1
s1 中出现了,其出现位置为
l
l
l。
现在请你求出
s
2
s_2
s2 在
s
1
s_1
s1 中所有出现的位置。
定义一个字符串
s
s
s 的 border 为
s
s
s 的一个非
s
s
s 本身的子串
t
t
t,满足
t
t
t 既是
s
s
s 的前缀,又是
s
s
s 的后缀。
对于
s
2
s_2
s2,你还需要求出对于其每个前缀
s
′
s'
s′ 的最长 border
t
′
t'
t′ 的长度。
输入格式
第一行为一个字符串,即为
s
1
s_1
s1。
第二行为一个字符串,即为
s
2
s_2
s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出
s
2
s_2
s2 在
s
1
s_1
s1 中出现的位置。
最后一行输出
∣
s
2
∣
|s_2|
∣s2∣ 个整数,第
i
i
i 个整数表示
s
2
s_2
s2 的长度为
i
i
i 的前缀的最长 border 长度。
样例 #1
样例输入 #1
ABABABC
ABA
样例输出 #1
1
3
0 0 1
数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
- Subtask 1(30 points): ∣ s 1 ∣ ≤ 15 |s_1| \leq 15 ∣s1∣≤15, ∣ s 2 ∣ ≤ 5 |s_2| \leq 5 ∣s2∣≤5。
- Subtask 2(40 points): ∣ s 1 ∣ ≤ 1 0 4 |s_1| \leq 10^4 ∣s1∣≤104, ∣ s 2 ∣ ≤ 1 0 2 |s_2| \leq 10^2 ∣s2∣≤102。
- Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1 ≤ ∣ s 1 ∣ , ∣ s 2 ∣ ≤ 1 0 6 1 \leq |s_1|,|s_2| \leq 10^6 1≤∣s1∣,∣s2∣≤106, s 1 , s 2 s_1, s_2 s1,s2 中均只含大写英文字母。
原题
代码
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int MAX = 1e6 + 6;
int Next[MAX];
vector<int> ans;
inline void GetNext(string s, int l) // 获得字符串s的Next数组
{
int t;
Next[0] = -1; // 如果在0位置失配则是向下移动一位
for (int i = 1; i < l; ++i) // 依次求解后面的Next数组
{
t = Next[i - 1];
while (s[t + 1] != s[i] && t >= 0)
t = Next[t];
if (s[t + 1] == s[i])
Next[i] = t + 1;
else
Next[i] = -1;
}
}
inline void KMP(string s1, int l1, string s2, int l2)
{
GetNext(s2, l2);
int i = 0, j = 0;
while (j < l1)
{
if (s2[i] == s1[j]) // 当前位匹配成功,继续匹配下一位
{
++i;
++j;
if (i == l2) // 完全匹配
{
ans.push_back(j - l2 + 1); // 储存答案
i = Next[i - 1] + 1; // 继续匹配
}
}
else
{
if (i == 0) // 在首位不匹配
j++;
else
i = Next[i - 1] + 1;
}
}
}
int main()
{
ios::sync_with_stdio(0);
cin.tie(0);
cout.tie(0);
string s1, s2;
cin >> s1 >> s2;
int l1 = s1.size();
int l2 = s2.size();
KMP(s1, l1, s2, l2);
for (int i = 0; i < ans.size(); i++)
{
cout << ans[i] << '\n';
}
for (int i = 0; i < l2; i++)
{
cout << Next[i] + 1 << ' ';
}
return 0;
}