• 给出一个字符串,要求计算出这一字符串的最长回文子串的长度。 如果遍历每一个字符,并以该字符为中心向两边查找,则其时间 复杂度为O(n2)。 • Manacher算法,又被戏称为“马拉车”算法,可以在时间复杂度 为O(n)的情况下求解一个字符串的最长回文子串的长度。
• 由于回文分为偶回文(例如"bccb")和奇回文(例如"bcacb"), 而在处理奇偶问题上会比较繁琐,例如,对于偶回文"bccb",其 对称中心是在两个‘c’字符之间;对于奇回文"bcacb",对称中心就 是‘a’字符。对此,Manacher算法在字符串首尾,及各字符间各插 入一个字符,而这个字符并未出现在字符串里。例如,字符串s是 “abbahopxpo”,用未出现在字符串里的‘#’字符插入,得新字符串 s_new是"KaTeX parse error: Expected 'EOF', got '#' at position 1: #̲a#b#b#a#h#o#p#x…’是为了防止越界。 在字符串S中,有一个偶回文"abba"和一个奇回文"opxpo",分别 被转换为"#a#b#b#a#“和”#o#p#x#p#o#",回文的长度都成了奇数。
• 对于p[i],如果i<mx,设j是i关于id对称点,如图所示,则基于以下三 种情况,可以求出p[i]的值: • (1)以j为中心的回文串有一部分在以id为中心的回文串之外。因为mx 是以id为中心的最长回文的右边界,所以以i为中心的回文串不可能会 有字符在以id为中心的回文串之外;否则mx就不是以id为中心的最长回 文的右边界。所以,在这种情况下,p[i]=mx–i。 • (2)以j为中心的回文串全部在以id为中心的回文串的内部,则 p[i]=p[j],而且p[i]不可能再增加。 • (3)以j为中心的回文串的左端正好与以id为中心的回文串的左端重合。 则p[i]=p[j]或p[i]=mx–i,并且p[i]还有可能会继续增加,即while (s_new[i-p[i]]==s_new[i+p[i]]) p[i]++; • 所以,if (i < mx) p[i] = min(p[2 * id - i], mx- i);其中2*id - i为i关于id的 对称点,即上面的j点,而p[j]表示以j为中心的最长回文半径,因此可 以利用p[j]来加快求解p[i]。
例:
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1000000;
int p[2*N+5];
char s[2*N+5],s_new[2*N+5];
int K;
int init()
{
int len=strlen(s),j=1,i;
s_new[0]='$',s_new[1]='#';
for(i=0;i<=len-1;i++)
s_new[++j]=s[i],s_new[++j]='#';
s_new[++j]='\0';
return j;
}
int manacher()
{
int len=init(),maxlen=-1;
int id=0,mx=0;
for(int i=0;i<=len-1;i++)
{
if(i<mx)
p[i]=p[2*id-i]<mx-i?p[2*id-i]:mx-i;
else
p[i]=1;
while(s_new[i-p[i]]==s_new[i+p[i]])
p[i]++;
if(mx<i+p[i])
id=i,mx=i+p[i];
maxlen=maxlen>p[i]-1?maxlen:p[i]-1;
}
return maxlen;
}
int main()
{
while(scanf("%s",s))
{
if(s[0]=='E'&&s[1]=='N'&&s[2]=='D')
break;
printf("Case %d: %d\n",++K,manacher());
}
return 0;
}