题目描述
给定一个字符串,求它的最长回文子串的长度。
分析
首先通过在每个字符的两边都插入一个特殊的符号,将所有可能的奇数或偶数长度的回文子串都转换成了奇数长度。比如 abba 变成 #a#b#b#a#, aba变成 #a#b#a#。
此外,为了进一步减少编码的复杂度,可以在字符串的开始加入另一个特殊字符,这样就不用特殊处理越界问题,比如$#a#b#a#。
以字符串12212321为例,插入#和$这两个特殊符号,变成了 S[] = "$#1#2#2#1#2#3#2#1#",然后用一个数组 P[i] 来记录以字符S[i]为中心的最长回文子串向左或向右扩张的长度(包括S[i])。
比如S和P的对应关系:
- S # 1 # 2 # 2 # 1 # 2 # 3 # 2 # 1 #
- P 1 2 1 2 5 2 1 4 1 2 1 6 1 2 1 2 1
可以看出,P[i]-1正好是原字符串中最长回文串的总长度,为5。
接下来怎么计算P[i]呢?Manacher算法增加两个辅助变量id和mx,其中id表示最大回文子串中心的位置,mx则为id+P[id],也就是最大回文子串的边界。得到一个很重要的结论:
- 如果mx > i,那么P[i] >= Min(P[2 * id - i], mx - i)
C代码如下:
//mx > i,那么P[i] >= MIN(P[2 * id - i], mx - i)
//故谁小取谁
if (mx - i > P[2*id - i])
P[i] = P[2*id - i];
else //mx-i <= P[2*id - i]
P[i] = mx - i;
下面,令j = 2*id - i,也就是说j是i关于id的对称点。
当 mx - i > P[j] 的时候,以S[j]为中心的回文子串包含在以S[id]为中心的回文子串中,由于i和j对称,以S[i]为中心的回文子串必然包含在以S[id]为中心的回文子串中,所以必有P[i] = P[j];
当 P[j] >= mx - i 的时候,以S[j]为中心的回文子串不一定完全包含于以S[id]为中心的回文子串中,但是基于对称性可知,下图中两个绿框所包围的部分是相同的,也就是说以S[i]为中心的回文子串,其向右至少会扩张到mx的位置,也就是说 P[i] >= mx - i。至于mx之后的部分是否对称,再具体匹配。
此外,对于 mx <= i 的情况,因为无法对 P[i]做更多的假设,只能让P[i] = 1,然后再去匹配。
综上,关键代码如下:
//输入,并处理得到字符串s
int p[1000], mx = 0, id = 0;
memset(p, 0, sizeof(p));
for (i = 1; s[i] != '\0'; i++)
{
p[i] = mx > i ? min(p[2 * id - i], mx - i) : 1;
while (s[i + p[i]] == s[i - p[i]])
p[i]++;
if (i + p[i] > mx)
{
mx = i + p[i];
id = i;
}
}
//找出p[i]中最大的
此Manacher算法使用id、mx做配合,可以在每次循环中,直接对P[i]的快速赋值,从而在计算以i为中心的回文子串的过程中,不必每次都从1开始比较,减少了比较次数,最终使得求解最长回文子串的长度达到线性O(N)的时间复杂度。
Go 语言实现如下:
package main
import (
"fmt"
"strings"
)
func MaxLengthPalindrome(str string) (int, string) {
// convert to #1#2#...n# mode
runes := []rune{}
for _, c := range str {
runes = append(runes, '#')
runes = append(runes, c)
}
runes = append(runes, '#')
n := len(runes)
dis := make([]int, n)
maxLenIndex := 0
maxLen := 1
dis[maxLenIndex] = 1
for i := 1; i < n; i++ {
if maxLenIndex+dis[maxLenIndex] > i {
mirrLen := dis[2*maxLenIndex-i]
// 直接找到长度
if mirrLen < maxLenIndex+dis[maxLenIndex]-i {
dis[i] = mirrLen
continue
}
// 找到边界(快速)
dis[i] = maxLenIndex + dis[maxLenIndex] - i
j := i + dis[i]
for ; j < n && 2*i-j >= 0; j++ {
if runes[j] != runes[2*i-j] {
break
}
}
dis[i] = j - i
if dis[i] > maxLen {
maxLen = dis[i]
maxLenIndex = i
fmt.Println(maxLen)
}
} else {
// 找到边界(一般)
dis[i] = 1
j := i + dis[i]
for ; j < n && 2*i-j >= 0; j++ {
if runes[j] != runes[2*i-j] {
break
}
}
dis[i] = j - i
if dis[i] > maxLen {
maxLen = dis[i]
maxLenIndex = i
}
}
}
findStr := strings.Join(strings.Split(string(runes[maxLenIndex-maxLen+1:maxLenIndex+maxLen]), "#"), "")
return (maxLen - 1), findStr
}
func main() {
str := "12212321"
fmt.Println(MaxLengthPalindrome(str))
}