最长回文子串

原题:http://hihocoder.com/problemset/problem/1032

问题:比如abacca里面aba和acca都是回文子串,最长的是acca。

思路1:枚举所有子串,然后逐个判断是否是回文子串,更新最长的长度。
评价:很明显是很逗啊,没必要,复杂度太高了,枚举每个子串就要O(n^2),每个子串要判断是否回文,还要O(n),乘起来就是O(n^3)了。

思路2:考虑到假如[2, 4]不是回文串,那么[1, 5]肯定也不是回文串了!所以可以枚举回文串的中心点 + 回文步长,来减少一些不必要的子串枚举。
评价:稍微好了点,不过得分奇数长度的字符串和偶数长度的字符串,实现略微冗余了点。而且,对于aaaaaaa这种类型的字符串,时间复杂度会达到O(n^2)!!!

思路3:可不可以考虑如何利用已经匹配到的信息,来去掉不必要的比较?

现在看一下在i前面,假设有一个点id,i关于id的对称点是j,即有数学关系id - j = i - id,移位化简得到j = 2*id - i。

由于j和id是在i前面的,所以我们已经知道以它们为中心的最长回文子串的长度了!设P[x] = 以x为中心的最长回文字符串沿中心折叠起来的长度,比如abcbad,其中以c为中心的最长回文字符串为abcba,折叠后编程cba,则P[c] = 3。

那么index(c) + P[c]表示什么意义呢?index(c) + 0表示c字符本身,index(c) + 1表示cba中的b,index(c) + 2表示cba中的a……index(c) + P[c] = index(c) + 3表示cba右边的一位,即以c为中心的最长回文字符串的边界!

好了,知道上面这些定义之后,就可以开始来分析了,从前面已经匹配过的信息中,我们可以为i得到哪些信息从而减少不必要的比较!

设mx = id + P[id],并假设mx > i,那么:

1)如果mx - i>= P[i](注意P[i]目前是未知的,只是分类讨论的假设而已),意味着以i为中心的最长回文串落在以id为中心的最长回文子串中,例如dabacabade,比如id表示c的位置4,而i表示右边的b的位置6,那么j = 2*id - i = 2,P[id] = 5, P[i] = 2,P[j] = 2,mx = 4 + 5 = 9表示e的位置。此时mx - i的意义其实很明显了,就是i点到id的”回文边界“的距离,这里计算得mx - i = 10 - 6 = 4 >= 2,即以i为中心的回文子串完全落在以id为中心的回文子串里面,由对称性可以知道,必然有P[i] = P[j](看上面的例子,可以用反证法证明的,假设两个不等,那么必然有一个比较大,那么……)。

2)如果mx - i < P[i],意味着这个时候以i为中心的回文子串有一部分落在id的”回文边界“之外,这意味着什么呢?比如abcba中以c为中心的最长回文字符串的P值为3,其实bcb也必定是一个回文串,其P值为2!!!,同样道理,此时P[i]至少是mx - i这么长(因为如果在步长为mx-i的时候,以i为中心的字符串就不是回文串了,那么肯定不可能有mx - i < P[i]),剩下的还需要继续比较匹配。

综上,当mx > i时,P[i] >= min(P[2*id-i], mx-i),看到这里应该都没什么问题。

那么当mx < i的时候呢?现在匹配到的信息没法给予什么指导,所以就设定P[i] = 1,从头开始匹配。

先贴代码实现,再来解释实现时候需要注意的细节:

// http://hihocoder.com/problemset/problem/1032?sid=811618
#include <stdio.h>
#include <cstring>
#include <algorithm>
using namespace std;


int const MAX = 1e6 + 5;
char str[MAX << 1];
int P[MAX << 1];


int Manacher() {
    int len = strlen(str);
    for (int i = len; i >= 0; --i) {
        str[(i << 1)+2] = str[i];
        str[(i << 1)+1] = '#';
    }
    str[0] = '$';

    int id = 0, mx = 0, end = (len << 1) + 1, ans = 0;
    for (int i = 2; i < end; ++i) {
        if (mx > i)
            P[i] = min(P[(id << 1)-i], mx-i);
        else
            P[i] = 1;
        while (str[i+P[i]] == str[i-P[i]])
            ++P[i];
        if (P[i] + i > mx) {
            id = i;
            mx = id + P[id];
        }
        ans = max(P[id], ans);
    }

    return ans - 1;
}

int main() {
    int n;
    scanf("%d", &n);

    while (n--) {
        scanf("%s", str);
        printf("%d\n", Manacher());
    }
    return 0;
}

A. 预处理
注意上面讨论的时候都是说”以xxx为中心“,所以目前只能处理长度为奇数的回文字符串,那对于abba这样的字符串怎么办呢?
其实做一下预处理就好了,插入一些间隔符号:@#a#b#b#a#\0,注意三个符号@#和\0,其中#是为了将所有回文字符串统一变成奇数长度的,比如aba变成了#a#b#a#,长度从3变到7;而abba变成了#a#b#b#a#,长度从4变成了9。而其余两个符号是为了越界处理,由于它们和其他任何符号都不同,而要越界的话,必然会经过它们,所以是不可能越界的,所以在代码里可以不用考虑越界!!!

B. 拿谁做id?
前面讨论的时候没有限定id是哪一个,只是说在i前面的一个点。但是,为了更好地覆盖后面的点,我们应该贪心选择”回文边界“最靠后的点!!!所以也就是上面while循环里最后更新mx和id的条件到这里应该也看懂了吧?

C. 最终的答案是?
从A中的长度变换后的分析可以知道,最终的答案为max(P[i]) - 1。

D. 分析一下对于aaaaaa这种情况,时间复杂度会不会退化为O(n^2)?
答案是不会的,可以自己写个程序验证一下~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值