【算法】——Manacher Algorithm（马拉车算法）

最新推荐文章于 2020-09-22 23:36:52 发布

数据库练兵场

最新推荐文章于 2020-09-22 23:36:52 发布

阅读量7.5k

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40449300/article/details/82320745

版权

Algorithm 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、马拉车算法来源

马拉车算法Manacher‘s Algorithm是用来查找一个字符串的最长回文子串的线性方法，由一个叫Manacher的人在1975年发明的，这个方法的最大贡献是在于将时间复杂度提升到了线性，这是非常了不起的。对于回文串想必大家都不陌生，就是正读反读都一样的字符串，比如 "bob", "level", "noon" 等等，那么如何在一个字符串中找出最长回文子串呢，可以以每一个字符为中心，向两边寻找回文子串，在遍历完整个数组后，就可以找到最长的回文子串。但是这个方法的时间复杂度为O(n*n)，并不是很高效，下面我们来看时间复杂度为O(n)的马拉车算法。

二、问题提出

最坏的情况就是各个回文相互重叠的时候。例如"aaaaaaaaaa"和" cabcbabcbabcba"。

为什么说有重叠时是最坏的情况？因为会发生重复计算。★（换句话说，没有重叠时，必须要一点一点计算，也就没有可改进的余地了。）

花费一些空间来避免重复计算。★

利用回文的特性避免重复计算。★

三、算法剖析

首先我们把字符串S改造一下变成T，改造方法是：在S的每个字符之间和S首尾都插入一个"#"。这样做的理由你很快就会知道。

例如，S="abaaba"，那么T="#a#b#a#a#b#a#"。

想一下，你必须在以Ti为中心左右扩展才能确定以Ti为中心的回文长度d到底是多少。（就是说这一步是无法避免的）

为了改进最坏的情况，我们把各个Ti处的回文半径存储到数组P，用P[i]表示以Ti为中心的回文长度。那么当我们求出所有的P[i]，取其中最大值就能找到最长回文子串了。

对于上文的示例，我们先直接写出所有的P研究一下。

i = 0 1 2 3 4 5 6 7 8 9 A B C

T = # a # b # a # a # b # a #

P = 0 1 0 3 0 1 6 1 0 3 0 1 0

显然最长子串就是以P[6]为中心的"abaaba"。

你是否发现了，在插入"#"后，长度为奇数和偶数的回文都可以优雅地处理了？这就是其用处。

现在，想象你在"abaaba"中心画一道竖线，你是否注意到数组P围绕此竖线是中心对称的？再试试"aba"的中心，P围绕此中心也是对称的。这当然不是巧合，而是在某个条件下的必然规律。我们将利用此规律减少对数组P中某些元素的重复计算。

我们来看一个重叠得更典型的例子，即S="babcbabcbaccba"。

上图展示了把S转换为T的样子。假设你已经算出了一部分P。竖实线表示回文"abcbabcba"的中心C，两个虚实线表示其左右边界L和R。你下一步要计算P[i]，i围绕C的对称点是i’。你有办法高效地计算P[i]吗？

我们先看一下i围绕C的对称点i’（此时i’=9）。

据上图所示，很明显P[i]=P[i’]=1。这是因为i和i’围绕C对称。同理，P[12]=P[10]=0，P[14]=P[8]=0。

现在再看i=15处。此时P[15]=P[7]=7？错了，你逐个字符检测一下会发现此时P[15]应该是5。

为什么此时规则变了？

如上图所示，两条绿色实线划定的范围必定是对称的，两条绿色虚线划定的范围必定也是对称的。此时请注意P[i’]=7，超过了左边界L。超出的部分就不对称了。此时我们只知道P[i]>=5，至于P[i]还能否扩展，只有通过逐个字符检测才能判定了。

在此例中，P[21]≠P[9]，所以P[i]=P[15]=5。

我们总结一下上述分析过程，就是这个算法的关键部分了。

if P[ i' ] < R – i,

then P[ i ] ← P[ i' ]

else P[ i ] ≥ R - i. (此时要穿过R逐个字符判定P[i]).

是不是很优雅？如果你能理解到这里，你已经搞定了这个算法最困难也最精华的部分了。

很明显C的位置也是需要移动的，这个很容易：

如果i处的回文超过了R，那么就C=i，同时相应改变L和R即可。

每次求P[i]，都有两种可能。如果P[i‘] < R – i，我们就P[i] = P[i’]。否则，就从R开始逐个字符求P[i]，并更新C及其R。此时扩展R（逐个字符求P[i]）最多用N步，而求每个C也总共需要N步。所以时间复杂度是2*N，即O(N)。

最近刷leetcode题目，正巧刷到最大回文串这题，折腾半天，发现马拉车这种神级算法，特此学习，做个记录，为日后翻看。本文参考来源：http://www.cnblogs.com/bitzhuwei/p/Longest-Palindromic-Substring-Part-II.html

数据库练兵场

关注

4
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

数据库练兵场 CSDN认证博客专家 CSDN认证企业博客

码龄7年

411: 原创

2万+: 周排名

2792: 总排名

155万+: 访问

: 等级

1万+: 积分

1154: 粉丝

1583: 获赞

186: 评论

4816: 收藏

私信

关注

热门文章

分类专栏

OceanBase 53篇
kubernetes 25篇
Architecture 1篇
Ottertune 7篇
DataBase 88篇
AI 13篇

最新评论

【OceanBase系列】—— OceanBase应急三板斧
ha_lydms: 非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞。
【OceanBase系列】—— OceanBase应急三板斧
旷世奇才李先生: 博主的文章总是如一盏明灯，指引我前进，每一篇博文都是一次心灵的提升，你的分享总是如此珍贵，你的博文总是让我拓展了视野，增长了见识，感谢你一直以来的无私奉献。期待更多知识的分享。非常感激你的专业知识传授。
Spring安装和使用(Eclipse环境)
圣心: 可以参考 spring 官方文档中文版本 https://spring-doc.cadn.net.cn/
【python基础】——python读写doc/docx/txt/xls文件
apprentices: pywintypes.com_error: (-2147352567, '发生意外。', (0, 'Kingsoft WPS', '文档打开失败。', '', 3010, -786427), None)这个问题如何处理呢
【OceanBase诊断调优】—— SQL 执行报错而不能计入 SQL_AUDIT 的情况
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。