给定一个字符串 S𝑆,以及一个模式串 P𝑃,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模式串 P𝑃 在字符串 S𝑆 中多次作为子串出现。
求出模式串 P𝑃 在字符串 S𝑆 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N𝑁,表示字符串 P𝑃 的长度。
第二行输入字符串 P𝑃。
第三行输入整数 M𝑀,表示字符串 S𝑆 的长度。
第四行输入字符串 S𝑆。
输出格式
共一行,输出所有出现位置的起始下标(下标从 00 开始计数),整数之间用空格隔开。
数据范围
1≤N≤1051≤𝑁≤105
1≤M≤1061≤𝑀≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
代码
#include <iostream>
using namespace std;
const int N = 100010, M = 1000010;
int n, m;
int ne[N];
char s[M], p[N];
int main()
{
cin >> n >> p + 1 >> m >> s + 1;
for (int i = 2, j = 0; i <= n; i ++ )//(索引为2,因为数组索引通常从1开始)
{
while (j && p[i] != p[j + 1]) j = ne[j]; //j有一个有效匹配部分且仍然不匹配,把j往后推进
//不匹配时进行快速回退,实在不行可能回到最初的 0
//匹配成功
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
for (int i = 1, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == n) //j匹配到了第一个字符串的尾巴,说明匹配完全成功
{
printf("%d ", i - n);
j = ne[j]; //回到之前,或者回到 0
}
}
return 0;
}
/*
cin >> n >> p + 1 >> m >> s + 1; 从第二个位置开始读取字符
*/