Manacher算法讲解

最新推荐文章于 2020-11-22 14:45:47 发布

汤智铖

最新推荐文章于 2020-11-22 14:45:47 发布

阅读量190

点赞数

分类专栏：算法

本文链接：https://blog.csdn.net/weixin_43217244/article/details/104050067

版权

算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

问题引入：求一个字符串 $s$ 里的回文子串（连续）的长度最大是多少？

例如 $s = " a a b a b a "$ ，最长回文子串的长度就是 $5$ （ $s_2s_3s_4s_5s_6=ababa$ ）。

主要思路：

$Sol\ 1:$ 暴力

这个应该不用多说了，枚举中点，时间复杂度 $\mathcal O(n^2)$ 。

$Sol\ 2:$ 二分+哈希

同样是枚举中点，然后二分回文串长度，时间复杂度 $\mathcal O(nlogn)$

$Sol\ 3:$ 就是我们所讲的manacher（马拉车）算法，时间复杂度 $\mathcal O(n)$ 。

1. $l e n$ 数组

回到 $Sol\ 1$ ，类比KMP算法，没有考虑到已经计算的部分对于之后结果的贡献，优化朴素方法的突破口就在这里了。

我们知道，回文串分奇回文串和偶回文串两种，奇回文串就是长度为奇数的回文串，如 $a a b a a$ ；偶回文串就是长度为偶数的回文串，如 $y c x x c y$ 。

为了避免分两种情况，我们可以在相邻两个字符之间插入一个 $∣$ 号，假设 $s = " a a b a b a "$ ，那么经过此次操作我们的字符串就变成了 $∣ a ∣ a ∣ b ∣ a ∣ b ∣ a$ 。

为了防止数组越界（由于在最前面的 $∣$ 的前一个字符和最后面的 $∣$ 的后一个字符都是’\0’，可能会导致 $w h i l e$ 陷入死循环），我们可以在最前面补上一个’#'符号。这样一来，我们字符串就变为

$i =$ $0\ \ \ 1\ \ \ 2\ \ \ 3\ \ 4\ \ 5\ \ \ 6\ \ 7\ \ \ 8\ \ 9\ \ 10\ \ 11\ 12$

$s =$ $\#\ \ \ |\ \ \ a\ \ \ |\ \ \ a\ \ \ |\ \ \ b\ \ \ |\ \ \ a\ \ \ |\ \ \ b\ \ \ |\ \ \ a$ 。

我们定义 $len_i$ 为以 $i$ 为中心的回文串的最大半径，如在上面的例子中， $len_8=6$ （由于 $∣ a ∣ b ∣ a ∣ b ∣ a ∣$ 为回文串，半径为 $6$ ）， $len_3=3$ （由于 $∣ a ∣ a ∣$ 为回文串，半径为 $3$ ）我们不难发现，对于每一个 $i$ ， $len_i-1$ 就是对应的原串中的回文子串的长度。

2.如何求 $l e n$ 数组？

假设我们现在再求 $len_i$ ，那么所有 $j\ (0 \leq j \lt i)$ ，它们的 $l e n$ 值是已经求得的，那么对于每一个 $k$ 都会有一个相应的回文串区间[ $k-len_k,k+len_k$ ]。假设所有区间右端点的最大值为 $m x$ ，取得最大值的 $k$ 为 $i d$ 。

在下图中，划下划线的部分就是对应的已知的回文串

对于 $\lt mx$ 的情况，假设 $i$ 关于 $i d$ 的对应点为 $j$ ， $m x$ 关于 $i d$ 的对称点为 $m x^{'}$ ，那么对于所有的 $\leq l \leq len_j$ ， $s_{j-l}=s_{j+l}$ ，又对于 $\leq l' \leq len_id$ ， $s_{id-l'}=s_{id+l'}$ ，因此对于$ 0 \leq l \leq min(len_j,j-mx’) $，$ len_{i+l}=len_{j-l}=len_{j+l}=len_{i-l}$，可以将 $len_i$ 赋上初值 $min(len_j,j-mx')$ ，即 $min(len_j,mx-i)$ 。

对于 $\geq mx$ 的情况，我们不知道之前的情况，只好将 $len_i$ 赋上初值 $1$ 。

两种情况赋上初值之后，分别向外扩展直到不能再扩展即可。

3.时间复杂度

和Z算法类似，只有遇到还没有匹配的位置时才进行匹配，已经匹配过的位置不再进行匹配，所以对于字符串中的每一个位置，只进行一次匹配。由于字符串的长度是线性 $\mathcal O(2|s|)$ 的，因此时间复杂度也是 $\mathcal O(n)$ 的。

4.代码：

以 P3805 模板题为例，代码如下。

#include <bits/stdc++.h>
using namespace std;
#define fi			first
#define se			second
#define fz(i,a,b)	for(int i=a;i<=b;i++)
#define fd(i,a,b)	for(int i=a;i>=b;i--)
#define put(x)		putchar(x)
#define eoln        put('\n')
#define space		put(' ')
inline int read(){
	int x=0,neg=1;char c=getchar();
	while(!isdigit(c)){
		if(c=='-')	neg=-1;
		c=getchar();
	}
	while(isdigit(c))	x=x*10+c-'0',c=getchar();
	return x*neg;
}
inline void print(int x){
	if(x<0){
		putchar('-');
		print(abs(x));
		return;
	}
	if(x<=9)	putchar(x+'0');
	else{
		print(x/10);
		putchar(x%10+'0');
	}
}
char s[22000005];//由于要添上|分隔符，空间要开2倍
int len[22000005],n=1;
inline void in(){//读入，由于题目输入量很大，要进行读入优化
    char c=getchar();
    s[0]='#',s[1]='|';//字符串操作添加#（防越界）和|（防分类讨论）两种预处理
    while(c<'a'||c>'z') c=getchar();
    while(c>='a'&&c<='z') s[++n]=c,s[++n]='|',c=getchar();
}
void Manacher(){
    int pos=0,mx=0;
    for(int i=1;i<=n;++i) {
        len[i]=i<mx?min(len[pos*2-i],mx-i):1;//关键语句，赋初值，分i<mx和i>=mx两种情况
        while(s[i-len[i]]==s[i+len[i]]) len[i]++;//向外扩展
        if(i+len[i]>mx)	mx=i+len[i],pos=i;//更新mx和pos
    }
}
int main(){
	in();
	Manacher();
	int ans=0;
	fz(i,1,n)	ans=max(ans,len[i]);
	cout<<ans-1<<endl;//对于每一个$i$，以它为中心的最长回文子串的长度为len[i]-1
	return 0;
}

注：本博客中的图片为https://www.cnblogs.com/Syameimaru/p/9310883.html中的图片

汤智铖

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Manacher算法讲解

问题引入：求一个字符串 sss 里的回文子串（连续）的长度最大是多少？例如 s="aababa"s="aababa"s="aababa"，最长回文子串的长度就是 555 （s2s3s4s5s6=ababas_2s_3s_4s_5s_6=ababas2s3s4s5s6=ababa）。主要思路：Sol 1:Sol\ 1:Sol 1: 暴力这个应该不用多说了，枚举中...
复制链接

扫一扫