最长回文子串_折叠回文子串-CSDN博客

本文链接：https://blog.csdn.net/Jacketinsysu/article/details/51781659

原题：http://hihocoder.com/problemset/problem/1032

问题：比如abacca里面aba和acca都是回文子串，最长的是acca。

思路1：枚举所有子串，然后逐个判断是否是回文子串，更新最长的长度。
评价：很明显是很逗啊，没必要，复杂度太高了，枚举每个子串就要O(n^2)，每个子串要判断是否回文，还要O(n)，乘起来就是O(n^3)了。

思路2：考虑到假如[2, 4]不是回文串，那么[1, 5]肯定也不是回文串了！所以可以枚举回文串的中心点 + 回文步长，来减少一些不必要的子串枚举。
评价：稍微好了点，不过得分奇数长度的字符串和偶数长度的字符串，实现略微冗余了点。而且，对于aaaaaaa这种类型的字符串，时间复杂度会达到O(n^2)！！！

思路3：可不可以考虑如何利用已经匹配到的信息，来去掉不必要的比较？

现在看一下在i前面，假设有一个点id，i关于id的对称点是j，即有数学关系id - j = i - id，移位化简得到j = 2*id - i。

由于j和id是在i前面的，所以我们已经知道以它们为中心的最长回文子串的长度了！设P[x] = 以x为中心的最长回文字符串沿中心折叠起来的长度，比如abcbad，其中以c为中心的最长回文字符串为abcba，折叠后编程cba，则P[c] = 3。

那么index(c) + P[c]表示什么意义呢？index(c) + 0表示c字符本身，index(c) + 1表示cba中的b，index(c) + 2表示cba中的a……index(c) + P[c] = index(c) + 3表示cba右边的一位，即以c为中心的最长回文字符串的边界！

好了，知道上面这些定义之后，就可以开始来分析了，从前面已经匹配过的信息中，我们可以为i得到哪些信息从而减少不必要的比较！

设mx = id + P[id]，并假设mx > i，那么：

1）如果mx - i>= P[i]（注意P[i]目前是未知的，只是分类讨论的假设而已），意味着以i为中心的最长回文串落在以id为中心的最长回文子串中，例如dabacabade，比如id表示c的位置4，而i表示右边的b的位置6，那么j = 2*id - i = 2，P[id] = 5, P[i] = 2，P[j] = 2，mx = 4 + 5 = 9表示e的位置。此时mx - i的意义其实很明显了，就是i点到id的”回文边界“的距离，这里计算得mx - i = 10 - 6 = 4 >= 2，即以i为中心的回文子串完全落在以id为中心的回文子串里面，由对称性可以知道，必然有P[i] = P[j]（看上面的例子，可以用反证法证明的，假设两个不等，那么必然有一个比较大，那么……）。

2）如果mx - i < P[i]，意味着这个时候以i为中心的回文子串有一部分落在id的”回文边界“之外，这意味着什么呢？比如abcba中以c为中心的最长回文字符串的P值为3，其实bcb也必定是一个回文串，其P值为2！！！，同样道理，此时P[i]至少是mx - i这么长（因为如果在步长为mx-i的时候，以i为中心的字符串就不是回文串了，那么肯定不可能有mx - i < P[i]），剩下的还需要继续比较匹配。

综上，当mx > i时，P[i] >= min(P[2*id-i], mx-i)，看到这里应该都没什么问题。

那么当mx < i的时候呢？现在匹配到的信息没法给予什么指导，所以就设定P[i] = 1，从头开始匹配。

先贴代码实现，再来解释实现时候需要注意的细节：

// http://hihocoder.com/problemset/problem/1032?sid=811618
#include <stdio.h>
#include <cstring>
#include <algorithm>
using namespace std;


int const MAX = 1e6 + 5;
char str[MAX << 1];
int P[MAX << 1];


int Manacher() {
    int len = strlen(str);
    for (int i = len; i >= 0; --i) {
        str[(i << 1)+2] = str[i];
        str[(i << 1)+1] = '#';
    }
    str[0] = '$';

    int id = 0, mx = 0, end = (len << 1) + 1, ans = 0;
    for (int i = 2; i < end; ++i) {
        if (mx > i)
            P[i] = min(P[(id << 1)-i], mx-i);
        else
            P[i] = 1;
        while (str[i+P[i]] == str[i-P[i]])
            ++P[i];
        if (P[i] + i > mx) {
            id = i;
            mx = id + P[id];
        }
        ans = max(P[id], ans);
    }

    return ans - 1;
}

int main() {
    int n;
    scanf("%d", &n);

    while (n--) {
        scanf("%s", str);
        printf("%d\n", Manacher());
    }
    return 0;
}

A. 预处理
注意上面讨论的时候都是说”以xxx为中心“，所以目前只能处理长度为奇数的回文字符串，那对于abba这样的字符串怎么办呢？
其实做一下预处理就好了，插入一些间隔符号：@#a#b#b#a#\0，注意三个符号@#和\0，其中#是为了将所有回文字符串统一变成奇数长度的，比如aba变成了#a#b#a#，长度从3变到7；而abba变成了#a#b#b#a#，长度从4变成了9。而其余两个符号是为了越界处理，由于它们和其他任何符号都不同，而要越界的话，必然会经过它们，所以是不可能越界的，所以在代码里可以不用考虑越界！！！

B. 拿谁做id？
前面讨论的时候没有限定id是哪一个，只是说在i前面的一个点。但是，为了更好地覆盖后面的点，我们应该贪心选择”回文边界“最靠后的点！！！所以也就是上面while循环里最后更新mx和id的条件到这里应该也看懂了吧？

C. 最终的答案是？
从A中的长度变换后的分析可以知道，最终的答案为max(P[i]) - 1。

D. 分析一下对于aaaaaa这种情况，时间复杂度会不会退化为O(n^2)？
答案是不会的，可以自己写个程序验证一下～