问题:从下面的字符串中找出最大的回文串,即最大的对称子串。
w a a b w s w f d
分析:
由于回文可能由奇数个字符组成,也可能由偶数个字符组成。对奇数回文的处理比较直观,只需要以某个字符为中心,依次向两边扩展即可。
因此,我们可以通过如下方式把对偶数回文的处理转换成对奇数回文的处理:在字符边界和每两个相邻字符中间插入一个分隔符,当然这个分隔符要在原串中没有出现过,
一般可以用‘#’分隔。
例如:
对字符串aba,预处理后变成#a#b#a#;
对字符串abba,预处理后变成#a#b#b#a。
这样就非常巧妙的将奇数长度回文串与偶数长度回文串统一起来考虑了。
然后用一个辅助数组P记录以每个字符为中心的最长回文串的信息。
P[id]记录的是以字符str[id]为中心的最长回文串,当以 str[id]为第一个字符,这个最长回文串向右延伸了P[id]个字符。
原串: w a a b w s w f d
新串: # w # a # a # b # w # s # w # f # d #
辅助数组P: 1 2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1
这里有一个很好的性质,P[id]-1就是该回文子串在原串中的长度(包括‘#’)。
现在的关键问题就在于怎么在O(n)时间复杂度内求出P数组了。
只要把这个P数组求出来,最长回文子串就可以直接扫一遍得出来了。
由于这个算法是线性从前往后扫的,那么当我们准备求P[i]的时候,i以前的P[j]我们是已经得到了的。
我们用mx记在i之前的回文串中,延伸至最右端的位置。
同时用id这个变量记下取得这个最优mx时的id值。(注:为了防止字符比较的时候越界,可以在这个加了‘#’的字符串之前还加了另一个特殊字符‘$’,故我们的新串下标是从1开始的)
代码如下:
void pk() { int i; int mx = 0; // mx记在i之前的回文串中,延伸至最右端的位置 int id; // id这个变量记下取得这个最优mx时的id值 for(i=1; i<n; i++) { if( mx > i ) p[i] = MIN( p[2*id-i], mx-i ); else p[i] = 1; for(; str[i+p[i]] == str[i-p[i]]; p[i]++) ; if( p[i] + i > mx ) { mx = p[i] + i; id = i; } } }
代码很短,而且相当好写,其实这就是一句代码:
if( mx > i )
p[i] = MIN( p[2*id-i], mx-i );
就是当前面比较的最远长度mx>i的时候,P[i]有一个最小值。这个算法的核心思想就在这里,为什么P数组满足这样一个性质呢?
大家可以画图理解