扩展 KMP

最新推荐文章于 2021-10-06 14:43:19 发布

心怀凉月

最新推荐文章于 2021-10-06 14:43:19 发布

阅读量173

点赞数

文章标签：扩展 KMP

本文链接：https://blog.csdn.net/qq_46258139/article/details/119897629

版权

扩展 `KMP`

简述

例题

给你两个字符串 $a$ ， $b$ ，长度分别为 $n$ ， $m$ 。

请输出 $b$ 的每一个后缀与 $b$ 的最长公共前缀以及 $a$ 的每一个后缀的最长公共前缀。

扩展 KMP：求出字符串 $a$ 的所有后缀与 $b$ 的最长公共前缀长度，时间复杂度 $\mathcal{O}(|S|+|T|)$ 。

该解法思想与 KMP 类似，所以称作扩展 KMP。

求法

定义 $next_i$ 为 $b$ 由 $i$ 开始的后缀与 $b$ 的最长公共前缀长度。（即为自配）

定义 $ext_i$ 为 $a$ 由 $i$ 开始的后缀与 $b$ 的最长公共前缀长度。

这是本题的第一问，也是第二问的辅助数组。

易得，此时 $next_0=|b|$ 。

思考，如果已知 $next_0 \sim next_{x-1}$ ，如何求 $next_x \ ?$

有一个较具体的例子，如果 $k = 121$ ，那么 $next_{0}$ 到 $next_{120}$ 都已经计算完毕，且 $l_{120}=100$ ， $r_{120}=130$ 。

这意味着 $b [100 . . 130] = b [0 . . 3]$ ，那么 $b [121 . . 130] = b [21 . . 30]$ ，这样 $next_{21}$ 对于计算 $next_{121}$ 就非常有帮助，如果 $next_{21}=3$ ，那么 $next_{121}=3$ 。

设 $next_0 \sim next_k$ 已经算好，记 $p$ 为在以前的匹配过程中在 $b$ 串中的最远位置，即 $p = m a x (i + n e x t [i] - 1)$ ，其中 $i = 1 . . . k$ 。

设取到这个最大值 $p$ 的位置是 $p 0$ 。

则 $a [p 0 . . . p] = b [0 . . . p - p 0]$ 。

假设 $i + n e x t [i - k] \leq p$ ，则 $next_x=next[x-k]$ 。

否则，暴力枚举 $next_x$ 。

求 $e x t$ 同理，若 $i + n e x t [i - k] \leq p$ ，则 $ext_x=next[x-k]$ 。

否则，暴力枚举 $ext_x$ 。

由于此时的 $k$ 不降，所以时间复杂度为 $\mathcal O(|S|)$ 。

$\Huge{to \ be \ continue}$

代码实现

#include <bits/stdc++.h>
using namespace std;

#define _ (int) 3e7 + 5

char a[_], b[_];

int n, m, nxt[_], ext[_];

long long Ans1, Ans2;

void get_nxt()
{
	nxt[0] = m;
	int j = 0;
	while(j + 1 < m && b[j] == b[j + 1]) ++j;
	nxt[1] = j;
	int k = 1;
	for(int i = 2; i < m; ++i)
	{
		int p = k + nxt[k] - 1;
		if(i + nxt[i - k] <= p) nxt[i] = nxt[i - k];
		else
		{
			j = max(p - i + 1, 0);
			while(i + j < m && b[i + j] == b[j]) ++j;
			nxt[i] = j;
			k = i;
		}
	}
}

void get_ext()
{
	int j = 0;
	while(j < n && j < m && a[j] == b[j]) ++j;
	ext[0] = j;
	int k = 0;
	for(int i = 1; i < n; ++i)
	{
		int p = k + ext[k] - 1;
		if(i + nxt[i - k] <= p) ext[i] = nxt[i - k];
		else
		{
			j = max(p - i + 1, 0);
			while(i + j < n && j < m && a[i + j] == b[j]) ++j;
			ext[i] = j;
			k = i;
		}
	}
}

signed main()
{
	scanf("%s%s", a, b);
	n = strlen(a);
	m = strlen(b);
	get_nxt();
	get_ext();
	for(int i = 0; i < m; ++i) Ans1 ^= 1ll * (i + 1) * (nxt[i] + 1);
	for(int i = 0; i < n; ++i) Ans2 ^= 1ll * (i + 1) * (ext[i] + 1);
	printf("%lld\n%lld\n", Ans1, Ans2);
	return 0;
}

心怀凉月

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
扩展 KMP

扩展 KMP简述例题给你两个字符串 aaa，bbb，长度分别为 nnn，mmm。请输出 bbb 的每一个后缀与 bbb 的最长公共前缀以及 aaa 的每一个后缀的最长公共前缀。扩展 KMP：求出字符串 aaa 的所有后缀与 bbb 的最长公共前缀长度，时间复杂度 O(∣S∣+∣T∣)\mathcal{O}(|S|+|T|)O(∣S∣+∣T∣)。该解法思想与 KMP 类似，所以称作扩展 KMP。求法定义 nextinext_inexti 为 bbb 由 iii 开始的后缀与 bbb
复制链接

扫一扫