马拉车算法用于求字符串的最长回文子串,Manacher算法将长度为奇数的回文串和长度为偶数的回文串一起考虑,处理之后得到的字符串的个数都是奇数个,先看一个简单的例题,然后分析最核心的一行代码
给出一个只由小写英文字符a,b,c...y,z组成的字符串S,求S中最长回文串的长度.
回文就是正反读都是一样的字符串,如aba, abba等
Input
输入有多组case,不超过120组,每组输入为一行小写英文字符a,b,c...y,z组成的字符串S
两组case之间由空行隔开(该空行不用处理)
字符串长度len <= 110000
Output
每一行一个整数x,对应一组case,表示该组case的字符串中所包含的最长回文长度.
Sample Input
aaaa abab
Sample Output
4 3
代码:
Select Code
#include<stdio.h>
#include<string.h>
#include<algorithm>
#define N 110005
using namespace std;
char ma[N*2];
int mp[N*2];
void ti(char x[],int len)
{
int i,j,l=0;
ma[l++]='$';
ma[l++]='#';
for(i=0;i<len;i++)
{
ma[l++]=x[i];
ma[l++]='#';
}
ma[l]=0;
int id=0,maxx=0;
for(i=0;i<l;i++)
{
mp[i]=maxx>i?min(mp[2*id-i],maxx-i):1;//核心代码
while(ma[i+mp[i]]==ma[i-mp[i]])
mp[i]++;
if(i+mp[i]>maxx)//又找到了一个更长的回文子串,更新
{
maxx=i+mp[i];
id=i;
}
}
}
int main()
{
char s[N];
while(~scanf("%s",s))
{
int l1=strlen(s);
ti(s,l1);
int ans=0,i;
for(i=0;i<2*l1+2;i++)
{
ans=max(ans,mp[i]-1);
}
printf("%d\n",ans);
}
return 0;
}
mp[i]=maxx>i?min(mp[2*id-i],maxx-i):1;//核心代码
自己的理解:
如果maxx>i,则i不超过maxx,那么,就有两种情况,一种是j的回文子串在maxx范围内,(i+j)/2=id,所以j=2*id-i;还有一种是j的回文子串也就是i的回文子串超过了maxx的范围,由于范围外不可知,因此只取范围内的,取这两者的最小值。加入maxx<i,
只能从1开始搜,也就是从自身开始搜。
参考别人的讲解:
MP[i]代表当前下标i为中心的字符串的回文串半径,马拉车主要就是优化了每次试探MP[i]的时候不一定需要从1开始慢慢向两边移动来试探。
id是已知的最长的回文串的中心,我们可以发现i关于id对称是j。由于i从2开始枚举过来,早就经过了j的位置,所以j位置的最长回文串已经确定如图所示,假设j的回文串完全被id的回文串所包围,那么,由回文串关于中心点对称的特性可以保证,i点的回文串的长度最少就是j点回文串的长度。即如果回文串的子串也是回文串,那么这个子串关于主串中心对称而得的子串也是一个回文串。接下来要确定的就是通过j点所能确定的i点回文串的长度最多是多少。首先应该明确,如果i点跑到mx(id点回文串所确定的范围边界)外面去了,那么j点无论如何缩减范围都不可能是id回文串的子串,就不满足上面加粗的结论了。就一定只能从1开始慢慢试探。这就是当mx < i的时候,MP[i] = 1的原因了。
接下来还有两种情况
一种就是上图中,j所确定的回文串完全被包含,即整个串都是其子串。那么i的可确定回文串范围就是j的回文串范围,MP[i]就变成了MP[j]。
还有一种情况就是j的回文串已经超出了mx的范围
对于红线以外的区域完全未知,所以必须将MP[j]减去红线外的范围才是i的可确定范围。或者理解为只有两端都去掉外面的部分之后,剩下的才是id回文串的子串,才可以对称过去成为i的回文串。然后再在已确定的范围基础上向两边扩展。