最长回文
-
描述
-
A string of the longest palindrome string.I just want the length.
This is a easy problem,yeah?-
输入
- Just a string who longest 110000. 输出
- Just a number. 样例输入
-
aaaa abab
样例输出
-
4
3
-
求回文子串 O(n) manacher 算法
回文串定义:“回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”
等等就是回文串。
回文子串,顾名思义,即字符串中满足回文性质的子串。
经常有一些题目围绕回文子串进行讨论,比如 HDOJ_3068_最长回文,求最长回文子
串的长度。朴素算法是依次以每一个字符为中心向两侧进行扩展,显然这个复杂度是 O(N^2)
的,关于字符串的题目常用的算法有 KMP、后缀数组、AC 自动机,这道题目利用扩展 KMP
可以解答,其时间复杂度也很快 O(N*logN)。但是,今天笔者介绍一个专门针对回文子串
的算法,其时间复杂度为 O(n),这就是 manacher 算法。
大家都知道,求回文串时需要判断其奇偶性,也就是求 aba 和 abba 的算法略有差距。
然而,这个算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考
虑,也就是在每个相邻的字符之间插入一个分隔符,串的首尾也要加,当然这个分隔符不能
再原串中出现,一般可以用‘#’或者‘$’等字符。例如:
原串:abaab
新串:#a#b#a#a#b#
这样一来,原来的奇数长度回文串还是奇数长度,偶数长度的也变成以‘#’为中心的
奇数回文串了。
接下来就是算法的中心思想,用一个辅助数组 P 记录以每个字符为中心的最长回文半
径,也就是 P[i]记录以 Str[i]字符为中心的最长回文串半径。P[i]最小为 1,此时回文串为 Str[i]
本身。
我们可以对上述例子写出其 P 数组,如下新串: # a # b # a # a # b #
P[] : 1 2 1 4 1 2 5 2 1 2 1
我们可以证明 P[i]-1 就是以 Str[i]为中心的回文串在原串当中的长度。
证明:
1、显然 L=2*P[i]-1 即为新串中以 Str[i]为中心最长回文串长度。
2、以 Str[i]为中心的回文串一定是以#开头和结尾的,例如“#b#b#”或“#b#a#b#”
所以 L 减去最前或者最后的‘#’字符就是原串中长度的二倍,即原串长度为(L-1)/2,化简
的 P[i]-1。得证。
依次从前往后求得 P 数组就可以了,这里用到了 DP(动态规划)的思想,也就是求 P[i]
的时候,前面的 P[]值已经得到了,我们利用回文串的特殊性质可以进行一个大大的优化。
我先把核心代码贴上:
for(i=1;i<n;i++)
{
if(MaxId>i)
{
p[i]=Min(p[2*id-i],MaxId-i);
}
else
{
p[i]=1;
}
while(a[i+p[i]]==a[i-p[i]])
{
p[i]++;
}
if(p[i]+i>MaxId)
{
MaxId=p[i]+i;
id=i;
}
}为了防止求 P[i]向两边扩展时可能数组越界,我们需要在数组最前面和最后面加一个特
殊字符,令 P[0]=‘$’最后位置默认为‘\0’不需要特殊处理。此外,我们用 MaxId 变量
记录在求 i 之前的回文串中,延伸至最右端的位置,同时用 id 记录取这个 MaxId 的 id 值。
通过下面这句话,算法避免了很多没必要的重复匹配。
if(MaxId>i)
{
p[i]=Min(p[2*id-i],MaxId-i);
}
那么这句话是怎么得来的呢,其实就是利用了回文串的对称性,如下图, -
-
j=2*id-i 即为 i 关于 id 的对称点,根据对称性,P[ j]的回文串也是可以对称到 i 这边的,
但是如果 P[ j]的回文串对称过来以后超过 MaxId 的话,超出部分就不能对称过来了,如下
图, -
-
所以这里 P[i]为的下限为两者中的较小者,p[i]=Min(p[2*id-i],MaxId-i)。
算法的有效比较次数为 MaxId 次,所以说这个算法的时间复杂度为 O(n)。
-
#include <stdio.h> #include <string.h> char str[220005]; int dp[220005]; int mymin(int a, int b) { return a < b ? a : b; } int main() { int len, i, id, maxR, maxLen; while(scanf("%s", str) != EOF) { memset(dp, 0, sizeof(dp)); len = strlen(str); id = maxR = maxLen = 0; for(i = len; i >= 0; i--) { str[i+i+2] = str[i]; str[i+i+1] = '#'; } // printf("%s\n", str); str[0] = '$'; for(i = 1; i <= 2*len+1; i++) { if(i < maxR) { dp[i] = mymin(dp[2*id-i], maxR-i); } else { dp[i] = 1; } while(str[i+dp[i]] == str[i-dp[i]]) { dp[i]++; } if(i+dp[i] > maxR) { maxR = i+dp[i]; id = i; } if(dp[i] > maxLen) { maxLen = dp[i]; } } /* for(i = 1; i <= 2*len+1; i++) { printf("%d ", dp[i]); } printf("\n");*/ printf("%d\n", maxLen-1); } return 0; }