Manacher算法总结

最新推荐文章于 2018-05-07 22:38:00 发布

XzzF1024

最新推荐文章于 2018-05-07 22:38:00 发布

阅读量445

点赞数 1

分类专栏：字符串

本文链接：https://blog.csdn.net/XzzF1024/article/details/80150516

版权

字符串专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、用途：

$\quad$ 给一个字符串，求它的最长回文子串；比如：
$\qquad$ s = "abbacbca"，最长回文子串为 "acbca"，长度为 $5$ ；
$\quad$ 如果用暴力的算法，枚举对称轴，向两边延伸；复杂度高达 $O(n^2)$ !
$\quad$ 有个叫 Manacher 的人发明了一种算法，可以 $O(n)$ 的求出最长回文子串，就叫 Manacher 算法(俗称马拉车算法)；

二、算法详情：

2.1 预处理：

$\quad$ 回文串分为奇回文串(如 "acbca") 和偶回文串(如 "abba")，处理的时候判奇偶是一件很麻烦的事，所以用一个小技巧对原串进行预处理：
$\quad \bullet$ 在头尾以及两两字符中间都插入一个无关字符 (没有出现在这个串中的字符)；
$\quad$ 举个例子："abcd" 填充之后变为 "#a#b#c#d#"；只要是无关字符都可以用来填充；
$\quad$ 偶回文串 "abba" 处理后变为 "#a#b#b#a#"，奇回文串 "acbca" 处理后变为 "#a#c#b#c#a#"，长度都变成了奇数；

2.2 p[] 的定义：

$\quad$ 首先定义一个 $p$ 数组：
$\quad \bullet$ $p[i]$ 表示以 $i$ 为中心的回文串的最大回文半径。
$\quad$ 比如：

i	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
New_s	@	#	a	#	b	#	b	#	a	#	c	#	b	#	c	#	a	#
p[i]		1	2	1	2	5	2	1	2	1	2	1	6	1	2	1	2	1

$\quad$ 可以看出， $max(p[i] - 1)$ 就是原串的最长回文子串的长度；

2.3 求解p[]

$\quad$ 假设我们正在求 $p[i]$ ，即 $p[1, \cdots, i-1]$ 都已求出；
$\quad$ 新增两个变量 Mr 和 Mid，定义如下：
$\qquad$ Mr : 中心在 $i$ 之前的所有回文子串，所能延伸至的最右端的位置；
$\qquad$ Mid : 右端延伸至 Mr 处的回文子串的中心位置；
$\qquad$ 即 Mid + p[Mid] = Mr；

$\quad$ 假设变量的相对位置如图：
$\quad$ (1) if (i < Mr)
$\qquad$ 即以 Mid 为中心的回文串为黑色的那段覆盖了红色的两段，根据回文串的性质，有 以 j 为中心 的回文串和 以 i 为中心 的回文串相等，即图中红色两段相等；
$\qquad$ 既然这样，就不用以 $i$ 为中心向两边延伸了，直接 p[i] = p[j] ，加速查找；
这里写图片描述
$\quad$ (2) else
$\qquad$ 即 i <script type="math/tex" id="MathJax-Element-5811">i</script> 在 Mr 右边，这种情况，只能老老实实向两边延伸了；

2.4 参考代码：

/**********************************************
 *Author*        :XzzF
 *Created Time*  : 2018/4/12 16:42:30
 *Ended  Time*  : 2018/4/12 16:57:48
*********************************************/

#include <cstdio>
#include <cstring>
#include <cmath>
#include <cstdlib>
#include <algorithm>
using namespace std;
typedef long long LL;
const int inf = 1 << 30;
const LL INF = 1LL << 60;
const int MaxN = 110005;

char s[MaxN + 5];
char New_s[2 * MaxN + 5];  //填充字符之后的串
int p[2 * MaxN + 5];  //p[i]表示以i为中心的最长回文串半径

int Get_New() {
    int len = strlen(s);
    New_s[0] = '@'; New_s[1] = '#';
    int L = 1;
    for(int i = 0; i < len; i++) {
        New_s[++L] = s[i];
        New_s[++L] = '#';
    }
    New_s[L + 1] = '\0';   //不要忘了
    return L;
}

int Manacher() {
    int len = Get_New();
    int Max_len = 0;
    int Mr = 0;       //遍历过的所有回文串中,所能到达的最右端的位置
    int Mid = 0;       //能到达最右端位置的回文串的中心位置
    for(int i = 1; i <= len; i++) {
        if(i < Mr) 
            p[i] = min(p[2 * Mid - i], Mr - i);
        else p[i] = 1;

        //不需边界判断,因为左有'@',右有'\0'
        while(New_s[i - p[i]] == New_s[i + p[i]])
            p[i]++;

        //更新Mr
        if(Mr < i + p[i]) {
            Mid = i;
            Mr = i + p[i];
        }
        Max_len = max(Max_len, p[i] - 1);
    }
    return Max_len;
}

int main()
{
    while(scanf("%s", s) != EOF)
    {
        printf("%d\n", Manacher());
    }
    return 0;
}