ne数组:当匹配不成功时存在的最大的前缀与后缀相等的数组如下图:即当模板链a(即最长的那条子链)和较短的子链b在p[i], 和s[j + 1]出不匹配时next[i]就表示子链z所表示的最大的前缀与后缀相等的数组
求next数组的代码如下:
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];//当第i个位置和第j + 1个位置不匹配时就跳到最大的 //前缀与后缀相等的位置即next[j]
if (p[i] == p[j + 1]) j ++ ;//若第i个位置和第j + 1个位置的字母相等,则继续往后找字母
ne[i] = j;
}
例题:
给定一个模式串 SS,以及一个模板串 PP,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串 PP 在模式串 SS 中多次作为子串出现。
求出模板串 PP 在模式串 SS 中所有出现的位置的起始下标。
输入格式
第一行输入整数 NN,表示字符串 PP 的长度。
第二行输入字符串 PP。
第三行输入整数 MM,表示字符串 SS 的长度。
第四行输入字符串 SS。
输出格式
共一行,输出所有出现位置的起始下标(下标从 00 开始计数),整数之间用空格隔开。
数据范围
1≤N≤1051≤N≤105
1≤M≤1061≤M≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
代码如下:
#include <iostream>
using namespace std;
const int N = 100010, M = 1000010;
char p[N], s[M];
int ne[N];
int n, m;
int main()
{
cin >> n >> p + 1 >> m >> s + 1;
for (int i = 2, j = 0; i <= n; i ++ )//求next
{
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
for (int i = 0, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == n)//说明找到一个子串
{
printf("%d ", i - n);
j = ne[j];
}
}
return 0;
}