算法用途
Manachar算法主要是处理字符串中关于回文串的问题的,它可以在 O(n) 的时间处理出以字符串中每一个字符为中心的回文串半径。
算法实现
统一字符串个数为奇数
Manacher运用了一个很巧妙的方法:在两个字符之间加入一个字符(包括首位,一般用#表示),这样2n个字符就变成了4n+1个,2n+1个就变成了4n+3个。
比如ababab,就变成了#a#b#a#b#a#b#。
除了这个以外,我们还可以在字符串的头部加一个字符(下面会有用的):
$#a#b#a#b#a#b#
计算p数组
什么是p数组呢?
同KMP的next数组一样,Manacher有一个p数组。p[i]存的是以i为回文中心的最长回文串的串长。
那要怎么求呢?
求p数组运用到了dp的思想。除此之外,还用到了两个变量:
① r,表示当前能推到的最远的编号。
② id,表示r对应的中点。
画个图吧(画图渣渣莫嫌弃):
假设我们现在推到i。那么有两种情况:
①
这里j是i关于id的对应点。因为整个id是回文的,因此p[j]=p[i]。
②
这里p[i]超出了r,但是i~r这段距离仍然满足。
所以我们可以写出状态转移式:
if (r>i)
p[i]=min(p[2*id-i],r-i);//j=id-(i-id)=2*id-i;
else//否则暂且把p[i]设为1
p[i]=1;
完了吗?
没呢!(看看就没有)
我们在原来的p[i]基础上继续推:
while (s[i-p[i]]==s[i+p[i]]) p[i]++;
这时我们之前在字符串头加的那个字符就起到了防止越界的作用。
改完p后,我们还需要更新id与r的值:
if (i+p[i]>r){//如果越界了
r=i+p[i];
id=i;
}
这回完了。
模板
#include<cstdio>
#include<cstring>
#include<algorithm>
#define MAXN 1000000
using namespace std;
int n;
char s[2*MAXN+5],s1[2*MAXN+5];
int p[2*MAXN+5];
int main(){
scanf("%d",&n);
while (n--){
scanf("%s",s);
memset(s1,0,sizeof(s1));
s1[0]='$';
for (int i=0;s[i];i++){
s1[2*i+1]='#';
s1[2*i+2]=s[i];
}
s1[strlen(s1)]='#';
memset(p,0,sizeof(p));
int id=0,r=0,ans=0;
for (int i=1;s1[i];i++){
if (r>i)
p[i]=min(p[id*2-i],r-i);
else
p[i]=1;
while (s1[i+p[i]]==s1[i-p[i]]) p[i]++;
if (p[i]+i>r){
r=p[i]+i;
id=i;
}
}
for (int i=0;s1[i];i++)
ans=max(ans,p[i]-1);
printf("%d\n",ans);
}
return 0;
}
#include<cstdio>
#include<cstring>
#include<algorithm>
#define MAXN 1100000
using namespace std;
int n;
char s[2*MAXN+5],s1[2*MAXN+5];
int p[2*MAXN+5];
int main(){
while (~scanf("%s",s)){
memset(s1,0,sizeof(s1));
s1[0]='$';
for (int i=0;s[i];i++){
s1[2*i+1]='#';
s1[2*i+2]=s[i];
}
s1[strlen(s1)]='#';
memset(p,0,sizeof(p));
int id=0,r=0,ans=0;
for (int i=1;s1[i];i++){
if (r>i)
p[i]=min(p[id*2-i],r-i);
else
p[i]=1;
while (s1[i+p[i]]==s1[i-p[i]]) p[i]++;
if (p[i]+i>r){
r=p[i]+i;
id=i;
}
}
for (int i=0;s1[i];i++)
ans=max(ans,p[i]-1);
printf("%d\n",ans);
}
return 0;
}