Manacher算法详解

最新推荐文章于 2023-08-08 23:19:26 发布

就叫昵称吧

最新推荐文章于 2023-08-08 23:19:26 发布

阅读量673

点赞数 4

分类专栏：算法和数据结构 Leetcode 文章标签：算法

本文链接：https://blog.csdn.net/qq_39378221/article/details/104555096

版权

Leetcode 同时被 2 个专栏收录

595 篇文章 0 订阅

订阅专栏

算法和数据结构

17 篇文章 1 订阅

订阅专栏

文章目录

1 算法背景
2 常规求解
3 Manacher算法
4 结束

1 算法背景

Manacher算法用于解决回文子串问题。给定字符串 $s$ ，求其回文子串，回文子串形如 $a b a$ 、 $a b b a$ 。例如：

s = "abcbbc"
回文子串有："bcb"、"cbbc"
最长回文子串为："cbbc"

1975年Manacher，提出Manacher算法将回文子串问题的时间复杂度提升为 $O (n)$

2 常规求解

回文串分奇回文（形如 $a b a$ ）和偶回文（形如 $a b b a$ ），最常规的求解方法就是以每个字符为中心向两端拓展，以及以两个相邻且相等字符为中心向两端拓展。这样做在处理上和时间复杂度上都很麻烦。下面来详细看看Manacher算法是怎样做的。

3 Manacher算法

3.1 字符串预处理

Manacher算法首先将整个字符串的首尾以及相邻字符之间插入一个没出现过的特殊字符，假设原字符串为：
$a b c b o h h o u$
插入 $\#$ 后得到的新字符串为：
$\#a\#b\#c\#b\#o\#h\#h\#o\#u\#$
这样做的好处就是将原来字符串中的奇回文和偶回文都变成了奇回文，如本例子中的 $\#b\#c\#b\#$ 和 $\#o\#h\#h\#o\#$ ，这样做就避免了处理上的不便。通常在编写算法的时候会额外在首尾加上两个其他未出现过的字符，方便边界处理，见3.5节伪代码。比如说这样：
$\$\#a\#b\#c\#b\#o\#h\#h\#o\#u\#\%$

3.2 回文半径数组

Manacher算法需要引入一个辅助数组 $a r r$ ，数组长度等于新字符串的长度，数组元素代表以当前字符为中心的最长回文子串的半径，所以叫它回文半径数组。上面的例子及对应的回文半径数组如下。

new_s	$	#	a	#	b	#	c	#	b	#	o	#	h	#	h	#	o	#	u	#	%
arr		1	2	1	2	1	4	1	2	1	2	1	2	5	2	1	2	1	2	1

知道了这个数组的定义后，我们可以很清楚地发现，以任意一个字符为中心的最长回文子串的长度就是该字符对应的数组元素值减1。例如 $\#b\#c\#b\#$ 是以 $c$ 为中心的回文子串，对应真实的 $b c b$ 长度就是 $4 - 1 = 3$ ； $\#o\#h\#h\#o\#$ 是以 $\#$ 为中心的回文子串，对应真实的 $o h h o$ 长度就是 $5 - 1 = 4$ 。
所以最重要的就是填充这个回文半径数组了。

3.3 对称关系

回文子串中心的两侧是镜面对称的如 $a b a c a b a$ ，这也就意味着在除了中心的整个回文子串内，以某一个字符为中心的回文串长度，等于以其对称位置字符为中心的回文串长度。例如 $a b a c a b a$ 中，以左边 $b$ 为中心的回文串长度等于以右边 $b$ 为中心的回文串长度。

3.4 填充数组

数组需要遍历填充，在遍历之前先维护两个变量，结合图片（假设数组已经填好一部分）解释其含义：
在这里插入图片描述

$c e n t e r$ ：表示到目前为止最右边界的回文子串的中心的位置，如上图，遍历到当前位置时，左边 $c$ 的半径能够得最远，别的中心加半径都够不到这么远；
$r\_border$ ：表示以 $c e n t e r$ 为中心， $a r r [c e n t e r]$ 为半径的回文子串的右边界，如上图。也就是说 $r\_border=center+arr[center]$

因此当遍历到第 $i$ 个字符的时候，如果 $i\lt r\_border$ ，那就意味着当前字符落入了以 $c e n t e r$ 为中心的回文子串中，那么我们就可以利用对称关系找到其对称字符的位置 $j = 2 * c e n t e r - i$ ，同时令 $a r r [i] = a r r [j]$ 。需要注意的是， $a r r [i]$ 还受右边界的影响，因此：
$arr[i]=min(arr[2*center-i],\ \ r\_border-i )$
拿上图的当前位置来说， $\#$ 落入了 $c$ 为中心的回文串中，那么这个位置就等于它关于 $c$ 对称位置的值，即 $1$ 。那什么时候受右边界影响呢，假设 $c$ 左边那个 $\#$ 的值为4（仅仅是假设！），那么当前位置就应该是 $r\_border-i=3$ ，因为我们不知道 $r\_border$ 往右那部分是啥，这也是上式的由来。
我们希望 $r\_border$ 越靠右边越好，这样能加速判断，所以要时刻更新 $c e n t e r$ 和 $r\_border$ 。

3.5 算法流程以及伪代码

算法流程如下：

字符串预处理得到 $new\_s$ ；
建立回文半径数组；
遍历字符串填充数组：
1）如果 $i\lt r\_border$ ，则 $arr[i]=min(arr[2*center-i],\ \ r\_border-i)$ ，否则 $a r r [i] = 1$
2）以 $new\_s[i]$ 为中心向两边拓展，同时更新 $a r r [i]$
3）如果 $i\gt r\_border$ ，更新 $c e n t e r = i$ ， $r\_border=arr[i]+i$

算法伪代码如下：

findPalindrome(s):

new_s = reprocess(s) #字符串预处理，插入无关字符以及首尾边界字符

for i = 1 to new_s.length then
	if arr[i] < r_border:  #当前元素落在右边界内，则找对称关系
		arr[i] = min(arr[2*center-i], r_border-i)
	else                   #否则arr[i] = 1
		arr[i] = 1
	end if 
	
	while new_s[i-arr[i]] == new_s[i+arr[i]] then #以i为中心向两端拓展，同时半径自增。首尾再加入无关字符就是为了处理边界
		arr[i]++
	end while

	if arr[i] + i > r_border then   #如果以字符为中心的回文子串右端超过右边界，则更新右边界和对称中心
		center = i
		r_border = arr[i]+i
	end if

3.6 实例

关说不练就比较难受了，拿一个简单例子 $b a b a d$ 来过一遍，对照着上面的伪代码。最开始让 $r\_border=center=0$ （别的值也无所谓，别影响后面第一步判断就行），开始填充下面这个数组。

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr

（1） $\ge r\_border$ 则 $a r r [1] = 1$ ，拓展后 $a r r [1]$ 仍为1，更新 $center=1,r\_border=2$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1

（2） $\ge r\_border$ 则 $a r r [2] = 1$ ，拓展后 $a r r [2]$ 为2，更新 $center=2,r\_border=4$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2

（3） $\lt r\_border$ 则 $arr[3] = min(arr[1],r\_border-3 )=1$ ，拓展后 $a r r [3]$ 仍为1，不更新 $center,r\_border$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1

（4） $\ge r\_border$ 则 $a r r [4] = 1$ ，拓展后 $a r r [4]$ 为4，更新 $center=4,r\_border=8$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4

（5） $\lt r\_border$ 则 $arr[5] =min(arr[3],r\_border-5 )=1$ ，拓展后 $a r r [5]$ 仍为1，不更新 $center,r\_border$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1

（6） $\lt r\_border$ 则 $arr[6] =min(arr[2],r\_border-6 )=2$ ，拓展后 $a r r [6]$ 为4，更新 $center=6,r\_border=10$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1	4

（7） $\lt r\_border$ 则 $arr[7] =min(arr[5],r\_border-7 )=1$ ，拓展后 $a r r [7]$ 仍为1，不更新 $center,r\_border$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1	4	1

（8） $\lt r\_border$ 则 $arr[8] =min(arr[4],r\_border-8 )=2$ ，拓展后 $a r r [8]$ 仍为2，不更新 $center,r\_border$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1	4	1	2

（9） $\lt r\_border$ 则 $arr[9] =min(arr[3],r\_border-9 )=1$ ，拓展后 $a r r [9]$ 仍为1，不更新 $center,r\_border$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1	4	1	2	1

（10） $\ge r\_border$ 则 $a r r [10] = 1$ ，拓展后 $a r r [10]$ 为2，更新 $center=10,r\_border=12$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1	4	1	2	1	2

（11） $\lt r\_border$ 则 $arr[11] =min(arr[9],r\_border-11 )=1$ ，拓展后 $a r r [11]$ 仍为1，不更新 $center,r\_border$ 。
在这里插入图片描述

new_s	$	#	b	#	a	#	b	#	a	#	d	#	%
arr		1	2	1	4	1	4	1	2	1	2	1

（12）结束。

4 结束

Leetcode 5是这个算法的练习。

就叫昵称吧

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Manacher算法详解

文章目录1 算法背景2 常规求解3 Manacher算法3.1 字符串预处理3.2 回文半径数组3.3 对称关系3.4 填充数组3.5 算法流程以及伪代码3.6 实例4 结束1 算法背景 Manacher算法用于解决最长回文子串问题。给定字符串sss，求其最长回文子串，回文子串形如abaabaaba、abbaabbaabba。例如：s = "abcbbc"回文子串有："bcb"、"cbb...
复制链接

扫一扫

专栏目录