回文这个东西,有一些不错的算法。比如马拉车算法,就是一种非常优秀的算法。
我也学过一篇有关马拉车的文章,非常的简单易懂。但我们今天讲的是比马拉车更强的算法——回文自动机。
回文自动机和AC自动机有一些类似的地方,所以有兴趣的同学可以看这篇文章来了解 AC自动机
好了,在开始今天的正文之前,我们得先定义一些数组,以便更好的了解回文自动机。
fail[x]:x失配后跳转到的不等于自身的最长后缀回文子串。(这个可能有点难看懂,但是参考AC自动机fail)
len[x]:以x为结尾的最长回文子串的长度。
cnt[x]:与以x结尾的最长回文子串相同的子串的个数
son[x][c]:编号为x的节点表示的回文串在两边添加字符c以后变成的回文串的编号
s[x]:第x次添加的字符(一开始设S[0] = -1,也可以是任意一个在串S中不会出现的字符)。
定义完这些数组后,我们就开始构建后缀自动机了。
首先我们建两个空节点0和1,其中
fail[0]=1,len[1]=−1
f
a
i
l
[
0
]
=
1
,
l
e
n
[
1
]
=
−
1
,这样的设定对后面有用。
然后我们读入一个字符,找出以它为结尾的最长回文子串的长度。这段找的代码如下:
ll get_fail(ll p,ll x){
while(s[x-len[p]-1]!=s[x]) p=fail[p];
return p;
}
那么节点x的最长回文子串的长度为函数
len[p]+2
l
e
n
[
p
]
+
2
。因为我们看某个回文子串的最左端是否和新加入的字符一样,如果一样那就是我们要求的回文子串,如果不一样,我们就跳转到当前回文串的最长后缀回文子串,继续匹配。是不是有点类似与AC自动机?
举个例子,比如当前串为cbbabb,那么最长的回文子串为bbabb,我们要加入字符a,那么a先与bbabb左边的字符(c)比较,发现不一样,于是跳转到bbabb的最长的后缀回文子串,也就是bb,继续匹配。发现bb左边的字符为a,和我们要加入的字符一样,所以新加入的len就是
len(bb)+2=4
l
e
n
(
b
b
)
+
2
=
4
,也就是子串abba。
然后我们再求出它的fail,也就是当前串abba的最长后缀回文子串,那么我们拿bb继续和a匹配,很遗憾不能匹配,所以会一路跳转到0,而
fail[0]=1
f
a
i
l
[
0
]
=
1
,所以到了点1,而
len[1]=−1
l
e
n
[
1
]
=
−
1
,带到我们的
get
g
e
t
_
fail
f
a
i
l
里发现是
s[x−(−1)−1]=s[x]
s
[
x
−
(
−
1
)
−
1
]
=
s
[
x
]
,也就意味着
s[x]=s[x]
s
[
x
]
=
s
[
x
]
所以它的最长后缀回文子串就是它自己b,所以我们把fail连到找到的点即可。fail[now]=son[get_fail(fail[cur],i)][s[i]-'a'];//cur=get_fail(last,i),s[i]是新加入的字符
建造的过程大家还可以自己举几个例子,再根据代码理解,应该比较容易理解。下面是代码:
#include<bits/stdc++.h>
#define MAXN 300010
#define ll long long
using namespace std;
ll read(){
char c;ll x;while(c=getchar(),c<'0'||c>'9');x=c-'0';
while(c=getchar(),c>='0'&&c<='9') x=x*10+c-'0';return x;
}
char s[MAXN];
ll fail[MAXN],son[MAXN][26],len[MAXN],cnt[MAXN];
ll tot,last,cur,ans;
ll newnode(ll x){
len[tot]=x;
return tot++;
}
ll get_fail(ll p,ll x){
while(s[x-len[p]-1]!=s[x]) p=fail[p];
return p;
}
int main()
{
scanf("%s",s+1);
s[0]=-1;fail[0]=1;last=0;
newnode(0);newnode(-1);
register int i;
for(i=1;s[i];i++){
cur=get_fail(last,i);
if(!son[cur][s[i]-'a']){
ll now=newnode(len[cur]+2);
fail[now]=son[get_fail(fail[cur],i)][s[i]-'a'];
son[cur][s[i]-'a']=now;
}
cnt[last=son[cur][s[i]-'a']]++;
}
for(i=tot-1;i>=0;i--){
cnt[fail[i]]+=cnt[i];
}
return 0;
}