使用 Manacher 算法解决最长回文子串问题

GreyZeng

已于 2022-11-19 17:27:57 修改

阅读量203

点赞数

分类专栏：算法和数据结构

于 2021-11-07 19:52:12 首次发布

本文链接：https://blog.csdn.net/hotonyhui/article/details/121196035

版权

算法 Manacher 数据结构 LeetCode 回文

算法和数据结构专栏收录该内容

148 篇文章 4 订阅

订阅专栏

使用 Manacher 算法解决最长回文子串问题

作者：Grey

原文地址：

博客园：使用 Manacher 算法解决最长回文子串问题

CSDN：使用 Manacher 算法解决最长回文子串问题

要解决的问题

求一个字符串最长回文子串是什么。且时间复杂度 O(N)

具体描述可参考：

LeetCode_5_最长回文子串

暴力解法

以每个字符为中心向左右两边扩，直到扩不动为止，记录下每个字符对应能扩的范围大小。因为有每个位置左右两边能扩的最大范围，我们可以很方便还原出最长回文子串是什么。

比如：AB1234321CD 这个字符串，以4字符为中心向左右两边能扩的位置最大，1234321 为最长回文子串。

如上解法有个问题，即针对类似1ABBA2这样的字符串，如上算法会错过最长回文子串ABBA, 因为ABBA不是以任何一个字符串向左右两边扩散得到的。所以，需要预处理一下原始字符串，预处理的方式如下：

在字符串的每两个位置之间插入一个特殊字符，变成一个预处理后的字符串，比如我们可以以#作为特殊字符（特殊字符选哪个无所谓，不必非要是原始串中不含有的字符），将1ABBA2这个字符串预处理成1#A#B#B#A#2，用预处理串来跑这个暴力解法，会得到#A#B#B#A#这个是预处理串的最长回文子串，我们可以很方便把这个串还原成原始串的最长回文子串。

暴力解法时间复杂度为O(N^2)。

暴力方法的示例代码如下：

public class LeetCode_0005_LongestPalindromicSubstring {
    // 暴力解法
    public static String longestPalindrome1(String s) {
        if (s.length() == 1) {
            return s;
        }
        char[] str = s.toCharArray();
        char[] mStr = manacherStr(str);
        int max = 1; // 最大回文长度至少是1
        int lM = 0; // 记录最长回文的左边界的上一个位置
        int rM = 0; // 记录最长回文的有边界的下一个位置
        for (int i = 1; i < mStr.length; i++) {
            int curMax = 1; // 当前的最大回文长度至少是1
            int l = i - 1;
            int r = i + 1;
            while (l >= 0 && r < mStr.length) {
                if (mStr[l] == mStr[r]) {
                    // 暴力扩充
                    l--;
                    r++;
                } else {
                    break;
                }
            }
            curMax = r - l - 1;
            if (curMax > max) {
                // 当前最长回文长度已经超过了max了
                // 更新中心值
                // 更新max值
                max = curMax;
                lM = l;
                rM = r;
            }
        }
        StringBuilder sb = new StringBuilder();
        for (int i = lM + 2; i < rM; i += 2) {
            sb.append(mStr[i]);
        }
        return sb.toString();
    }

    public static char[] manacherStr(char[] str) {
        final char c = '#';
        char[] mStr = new char[(str.length << 1) | 1];
        mStr[0] = c;
        mStr[1] = str[0];
        int index = 1;
        for (int i = 2; i < mStr.length; i++) {
            if ((i & 1) != 1) {
                mStr[i] = c;
            } else {
                mStr[i] = str[index++];
            }
        }
        return mStr;
    }
}

Manacher算法

Manacher算法可以用O(N)时间复杂度解决这个问题。同样的，Manacher算法也需要对原始字符串进行上述的预处理过程。

情况1

i在r外，比如初始状态下：i=1, r,c = 0

在这种情况下，流程如暴力解法一样，以i位置为中心，左右两边扩到不能再扩的位置，更新pArr[i]，c，r的值。

情况2

i在r内或者i==r

在这种情况下，我们假设i'为i关于c对称的点，r'为r关于c对称的点，示例图如下：

情况2细分如下几种情况：

情况2-1

i'自己的回文区域都在[r'...r]内。

例如下图中[6...10]为i'的最长回文区域，左边界并未超过r'

由此可以推出，由于i位置和i'位置是关于c位置对称的，则i位置的回文区域至少包括[14...19]这一段，如下图

即pArr[i']至少等于pArr[i]，接下来考虑i能否继续扩散，即考虑19位置的值是否等于13位置的值，

我们可以假设：19位置的值和13位置的值相等，

同时，因为C是中心点，有如下两个显而易见的结论：

结论1：19位置的值等于5位置的值。

结论2：13位置的值等于11位置的值。

根据上述两个结论，可以推出以下这个结论3：

结论3：5位置的值和11位置的值相等，

又因为我们前面假设：i’只能扩散到最左6位置以及最右10位置，

这个假设和结论3矛盾。所以，19位置的值不等于13位置的值

所以情况2-1的结论是：i的最长回文区域长度和i'的答案一样, 即：pArr[i'] = pArr[i]

情况2-2

i'自己的回文区域在[r'...r]外

如下图

其中[2...14]范围是以i'为中心的最长回文区域。

在情况2-2下，我们可以得到如下几个结论：

根据i和i'的关系，以i为中心，从[13...19]至少是回文的。
根据i'的回文区域，12位置的值等于4位置的值，以c为中心，4位置的值又等于20位置的值，所以12位置的值等于20位置的值，即以i为中心，最长回文区域还可以扩展到[12...20]。
根据i'的回文区域，13位置的值等于3位置的值，以c为中心，13位置的值又等于11位置的值，3位置的值等于21位置上的值，所以11位置的值等于21位置的值，即以i为中心，最长回文区域还可以扩展到[11...21]。
继续判断以i为中心，是否可以继续扩散，即要继续判断10位置的值是否等于22位置的值，我们假设10位置的值等于22位置的值，以c为中心，10位置的值等于14位置的值，以i'为中心，14位置的值等于2位置的值，所以10位置的值等于2位置的值，根据我们的假设，2位置的值会等于22位置的值。这个与我们的前提矛盾了，因为我们的前提是c只能扩展到[3...21]这个区域，即：2位置的值不可能等于22位置的值，所以我们的假设不成立，所以10位置的值不等于22位置的值。

所以，情况2-2的结论是：i到r的距离就是i的回文半径，即：pArr[i] = r - i + 1

情况2-3

i'自己的回文区域左边界和r'压线

如下图

其中[3...13]区域为以i'为中心能扩的最大回文区域。

有了情况2-2的铺垫，i在情况2-3条件下至少可以扩充的范围是[11...21], 但是接下来是否可以继续扩充，还需要逐个判断。即：10位置的值是否等于22位置的值，9位置的值是否等于23位置的值…

自此，所有情况考虑完毕。

时间复杂度

由于i在遍历过程中，始终不回退，所以，Manacher算法时间复杂度O(N)

完整代码

public class LeetCode_0005_LongestPalindromicSubstring {
    
    public static String longestPalindrome(String s) {
        if (s == null || s.length() <= 1) {
            return s;
        }
        char[] str = s.toCharArray();
        char[] strs = manacherStr(str);
        int[] pArr = new int[strs.length];
        int c = 0;
        int r = 0;
        int i = 1;
        int len = strs.length;
        int max = 1;
        while (i < len) {
            // pArr[i] 至少不需要扩的大小
            pArr[i] = i < r ? Math.min(r - i, pArr[c - (i - c)]) : 1;
            // 暴力扩
            while (i + pArr[i] < len && i - pArr[i] >= 0) {
                if (strs[i + pArr[i]] == strs[i - pArr[i]]) {
                    pArr[i]++;
                } else {
                    break;
                }
            }
            // 扩散的位置能否更新回文有边界R
            // 如果可以更新，则更新R，且把C置于当前的i，因为是当前的i让回文右边界扩散的
            if (i + pArr[i] > r) {
                r = i + pArr[i];
                c = i;
            }
            max = Math.max(pArr[i++], max);
        }

        // 定位最大回文有边界的回文中心是哪个
        int n = 0;
        for (; n < len; n++) {
            if (pArr[n] == max) {
                break;
            }
        }

        // 构造最大回文子串
        StringBuilder sb = new StringBuilder();
        for (i = n - max + 2; i < n + max; i += 2) {
            sb.append(strs[i]);
        }
        return sb.toString();
    }

    public static char[] manacherStr(char[] str) {
        char[] strs = new char[str.length << 1 | 1];
        for (int i = 0; i < strs.length; i++) {
            strs[i] = ((i & 1) == 1) ? str[i >> 1] : '#';
        }
        return strs;
    }
}