Manacher算法

2人阅读 评论(0) 收藏 举报
分类:

一:背景

给定一个字符串,求出其最长回文子串。例如:

  1. s="abcd",最长回文长度为 1;
  2. s="ababa",最长回文长度为 5;
  3. s="abccb",最长回文长度为 4,即bccb。

以上问题的传统思路大概是,遍历每一个字符,以该字符为中心向两边查找。其时间复杂度为$O(n^2)$,效率很差。

1975年,一个叫Manacher的人发明了一个算法,Manacher算法(中文名:马拉车算法),该算法可以把时间复杂度提升到$O(n)$。下面来看看马拉车算法是如何工作的。

二:算法过程分析

由于回文分为偶回文(比如 bccb)和奇回文(比如 bcacb),而在处理奇偶问题上会比较繁琐,所以这里我们使用一个技巧,具体做法是:在字符串首尾,及各字符间各插入一个字符(前提这个字符未出现在串里)。

举个例子:s="abbahopxpo",转换为s_new="$#a#b#b#a#h#o#p#x#p#o#"(这里的字符 $ 只是为了防止越界,下面代码会有说明),如此,s 里起初有一个偶回文abba和一个奇回文opxpo,被转换为#a#b#b#a##o#p#x#p#o#,长度都转换成了奇数

定义一个辅助数组int p[],其中p[i]表示以 i 为中心的最长回文的半径,例如:

i012345678910111213141516171819
s_new[i]$#a#b#b#a#h#o#p#x#p#
p[i] 1212521212121214121

可以看出,p[i] - 1正好是原字符串中最长回文串的长度。

接下来的重点就是求解 p 数组,如下图:

设置两个变量,mx 和 id 。mx 代表以 id 为中心的最长回文的右边界,也就是mx = id + p[id]

假设我们现在求p[i],也就是以 i 为中心的最长回文半径,如果i < mx,如上图,那么:

if (i < mx)  
    p[i] = min(p[2 * id - i], mx - i);

2 * id - i为 i 关于 id 的对称点,即上图的 j 点,而p[j]表示以 j 为中心的最长回文半径,因此我们可以利用p[j]来加快查找。

三:代码

#include <iostream>  
#include <cstring>
#include <algorithm>  

using namespace std;

char s[1000];
char s_new[2000];
int p[2000];

int Init()
{
    int len = strlen(s);
    s_new[0] = '$';
    s_new[1] = '#';
    int j = 2;

    for (int i = 0; i < len; i++)
    {
        s_new[j++] = s[i];
        s_new[j++] = '#';
    }

    s_new[j] = '\0';  // 别忘了哦
    
    return j;  // 返回 s_new 的长度
}

int Manacher()
{
    int len = Init();  // 取得新字符串长度并完成向 s_new 的转换
    int max_len = -1;  // 最长回文长度

    int id;
    int mx = 0;

    for (int i = 1; i < len; i++)
    {
        if (i < mx)
            p[i] = min(p[2 * id - i], mx - i);  // 需搞清楚上面那张图含义, mx 和 2*id-i 的含义
        else
            p[i] = 1;

        while (s_new[i - p[i]] == s_new[i + p[i]])  // 不需边界判断,因为左有'$',右有'\0'
            p[i]++;

        // 我们每走一步 i,都要和 mx 比较,我们希望 mx 尽可能的远,这样才能更有机会执行 if (i < mx)这句代码,从而提高效率
        if (mx < i + p[i])
        {
            id = i;
            mx = i + p[i];
        }

        max_len = max(max_len, p[i] - 1);
    }

    return max_len;
}

int main()
{
    while (printf("请输入字符串:\n"))
    {
        scanf("%s", s);
        printf("最长回文长度为 %d\n\n", Manacher());
    }
    return 0;
}

四:算法复杂度分析

文章开头已经提及,Manacher算法为线性算法,即使最差情况下其时间复杂度亦为$O(n)$,在进行证明之前,我们还需要更加深入地理解上述算法过程。

根据回文的性质,p[i]的值基于以下三种情况得出:

(1):j 的回文串有一部分在 id 的之外,如下图:

上图中,黑线为 id 的回文,i 与 j 关于 id 对称,红线为 j 的回文。那么根据代码此时p[i] = mx - i,即紫线。那么p[i]还可以更大么?答案是不可能!见下图:

假设右侧新增的紫色部分是p[i]可以增加的部分,那么根据回文的性质,a 等于 d ,也就是说 id 的回文不仅仅是黑线,而是黑线+两条紫线,矛盾,所以假设不成立,故p[i] = mx - i,不可以再增加一分。

(2):j 回文串全部在 id 的内部,如下图:

根据代码,此时p[i] = p[j],那么p[i]还可以更大么?答案亦是不可能!见下图:

假设右侧新增的红色部分是p[i]可以增加的部分,那么根据回文的性质,a 等于 b ,也就是说 j 的回文应该再加上 a 和 b ,矛盾,所以假设不成立,故p[i] = p[j],也不可以再增加一分。

(3):j 回文串左端正好与 id 的回文串左端重合,见下图:

根据代码,此时p[i] = p[j]p[i] = mx - i,并且p[i]还可以继续增加,所以需要

while (s_new[i - p[i]] == s_new[i + p[i]]) 
    p[i]++;
查看评论

数据结构和算法

本次课主要是介绍在游戏开发中经常使用的数据结构,例如数组,链表,栈,队列,二叉树,递归等重要知识点讲解以及将它们里灵活的运用到算法里面。
  • 2015年01月29日 08:45

Manacher算法总结

Manacher算法 算法总结第三弹 manacher算法,前面讲了两个字符串相算法——kmp和拓展kmp,这次来还是来总结一个字符串算法,manacher算法,我习惯叫他 “马拉车”算法。 相对于前...
  • dyx404514
  • dyx404514
  • 2014-12-21 16:10:27
  • 14970

Manacher算法及其Java实现

Manacher算法及其Java实现Manacher算法及其Java实现 说明 实现步骤 基本过程 完整实现 确定最小半径 具体代码 复杂度分析 参考 原载于天意博文说明现给定一个已知的字符串str[...
  • SiMaXiaoChen
  • SiMaXiaoChen
  • 2017-03-14 14:57:36
  • 1176

Manacher算法详解

Mancher算法如今已是一个常被涉及的的算法,主要适用于和回文串相关的一些题目,虽然说不常用(对于OI的其他算法而言),但却是一个很重要的算法。...
  • WenDavidOI
  • WenDavidOI
  • 2016-08-08 09:45:30
  • 580

Manacher算法 with c++

今天看Design of Computer Programs的时候突然出现了最长回文子字符串问题..顺便就研究了一下Manacher算法. 求证的话别的博客有,我觉得关键就是两点,一个是将字符串经过...
  • u013795429
  • u013795429
  • 2015-12-22 11:14:12
  • 576

Manacher算法(最大回文子串),JAVA实现

推荐大家一个视频。http://www.bilibili.com/video/av4829276/index_1.html。讲manacher算法的。看了好几个博文都不太理解,最后搜了一下视频。很有帮...
  • w5761499123
  • w5761499123
  • 2017-03-11 16:53:38
  • 908

manacher算法的实现

manacher算法的解释见 这里。 //求字符串s中最大回文的长度,要求字符串s不包含字符‘#’ int manacher(const string &s) { if (s.si...
  • bupt8846
  • bupt8846
  • 2015-06-05 11:51:31
  • 811

最长回文字符串_Manacher算法_(O(n))

朴素算法求最长回文字符串包括奇数长的和偶数长的,求的时候都要分情况讨论,Manacher算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考虑,也就是在每个相邻的字符之间插入一个分隔...
  • Z_zhangyinqian
  • Z_zhangyinqian
  • 2015-09-09 18:33:05
  • 460

51nod 1089 最长回文子串 V2 (Manacher算法)

回文串是指aba、abba、cccbccc、aaaa这种左右对称的字符串。 输入一个字符串Str,输出Str里最长回文子串的长度。 Input 输入Str(Str的长度 ...
  • h1021456873
  • h1021456873
  • 2015-10-30 10:11:40
  • 782

Manacher算法,最长回文串,时间复杂度O(n)

本文地址:http://blog.csdn.net/qq_26437925/article/details/52181738 本文参考了牛客网左程云牛客网视频,对Manacher算法整理成文最长回文...
  • qq_26437925
  • qq_26437925
  • 2016-08-11 13:21:17
  • 309
    个人资料
    持之以恒
    等级:
    访问量: 6859
    积分: 1133
    排名: 4万+
    最新评论