Next[i]表示:以i为终点的字符串,后缀和前缀相等的最大长度
用数组表示:Next[i] = j
等价于 str[1~j] = str[i-j+1 ~ i]
下图表示匹配的过程。蓝色线条是 后缀和前缀相等的最长字符串。
可以看到,如果已知Next,在s2的位置i+1匹配失败后,没必要从s2的开头匹配,直接从位置Next[i]处开始匹配即可。
模板如下:
#include <iostream>
#include <cstring>
using namespace std;
const int N = 1000005;
char s1[N], s2[N];
int nxt[N];
int main() {
scanf("%s%s", s1 + 1, s2 + 1);
int n = strlen(s1 + 1);
int m = strlen(s2 + 1);
//求next
for (int i = 2, j = 0; i <= m; i ++) // next[1]=0,所以从i=2开始算
{
while (j && s2[i] != s2[j + 1]) j = nxt[j];
if (s2[i] == s2[j + 1]) j ++ ;
nxt[i] = j;
}
//匹配
for (int i = 1, j = 0; i <= n; i ++ )
{
while (j && s1[i] != s2[j + 1]) j = nxt[j]; // 匹配失败,跳转到s2的位置nxt[j]继续匹配
if (s1[i] == s2[j + 1]) j ++ ; // 匹配成功,继续看下一位
if (j == m) // s2完全匹配成功
{
j = nxt[j]; // 匹配成功后,s2也要往后挪
// 匹配成功后的操作
}
}
return 0;
}
该题代码
#include <iostream>
#include <cstring>
using namespace std;
const int N = 1000005;
char s1[N], s2[N];
int nxt[N];
int main() {
scanf("%s%s", s1 + 1, s2 + 1);
int n = strlen(s1 + 1);
int m = strlen(s2 + 1);
//求next
for (int i = 2, j = 0; i <= m; i ++) // next[1]=0,所以从i=2开始算
{
while (j && s2[i] != s2[j + 1]) j = nxt[j];
if (s2[i] == s2[j + 1]) j ++ ;
nxt[i] = j;
}
//匹配
for (int i = 1, j = 0; i <= n; i ++ )
{
while (j && s1[i] != s2[j + 1]) j = nxt[j]; // 匹配失败,跳转到s2的位置nxt[j]继续匹配
if (s1[i] == s2[j + 1]) j ++ ; // 匹配成功,继续看下一位
if (j == m) // s2完全匹配成功
{
j = nxt[j]; // 匹配成功后,s2也要往后挪
// 匹配成功后的操作
printf("%d\n", i - m + 1);
}
}
for (int i = 1; i <= m; i ++) {
printf("%d ", nxt[i]);
}
return 0;
}
从代码可以看出时间复杂度是O(n)
的,因为对于每个i,j最多+1(23行),所以总共最多加n次,因此遍历所有的i,while循环内(22行)j总共最多往回跳n次(每次往回跳j至少-1)。