最大公共前后缀
前缀:必须包含第一个元素但不能包含最后一个;
后缀:必须包含最后一个元素但不能包含第一个;
(1)最大公共前后缀:满足前缀和后缀长度和元素对应相等条件下长度最长的前后缀;
(2)
n
e
x
t
[
i
]
next[i]
next[i]:字符串中以
i
i
i为结尾的那段所拥有的最大公共前后缀的长度,根据前后缀定义当只有一个元素时
n
e
x
t
next
next数组值为0;
题目(来自AcWing上的一道KMP模板题)
给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式:
第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串S。
输出格式:
共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。
数据范围:
1≤N≤105
1≤M≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
思路
求next数组的过程就是相当于把模板串也当成一个主串,然后求模板串和这个时候主串对应的匹配关系,如果匹配了,主串中对应的下标i对应到模板串中的 j + 1 j+1 j+1,就相当于滑动之后可以直接从 j + 1 j+1 j+1开始进行匹配。
j = n e [ j ] j=ne[j] j=ne[j]:当模板串和主串不匹配时(此时主串下标为 i i i,模板串下标为 j j j,比较的是 s [ i ] s[i] s[i]和 p [ j + 1 ] p[j+1] p[j+1]),j往回跳再次进行匹配。
#include <iostream>
using namespace std;
const int N = 1e6 + 10;
int n, m, ne[N];
char s[N], p[N];
int main(){
cin >> m >> p + 1 >> n >> s + 1;//模式串和模板串均从1开始遍历比较方便
//求next数组(此时p既是模板串又是模式串)
for(int i = 2, j = 0; i <= m; i++){
while(j && p[i] != p[j + 1]) j = ne[j];//当匹配不成功时j往前跳
if(p[i] == p[j + 1]) j++;
ne[i] = j;
}
//模板串和主串进行匹配
for(int i = 1, j = 0; i <= n; i++){
while(j && s[i] != p[j + 1]) j = ne[j];//这里匹配时用p[j + 1]是因为j从0开始但是模板串从1开始
if(s[i] == p[j + 1]) j++;
if(j == m) cout << i - m << " ";
}
return 0;
}