写在前面
如果你会 S A M SAM SAM,相信回文自动机不会难懂。
如果你不会,你可以参考我的上一篇文章。
至少回文自动机是治愈系的吧。
作用
回文自动机,也叫回文树,简称
P
A
M
PAM
PAM实际上它既不是自动机也不是树
处理回文串的有力工具。可完全代替 M a n a c h e r Manacher Manacher,就是会多个字符集。
算法流程
首先一个结论:往一个串末尾加入一个字符,最多会增加一个没出现过的回文串。
证明:
假设出现了两个之前没有出现的,它们都是当前串的后缀。
根据对称性,把短的关于长的的中心作对称,得到一个相同的回文串,说明已经出现过了。
矛盾,所以最多出现一个。
这么说,对于字符串 S S S,本质不同的回文串最多有 ∣ S ∣ |S| ∣S∣个。
于是可以每个状态表示一个本质相同的回文串。用 l e n i len_i leni表示状态 i i i表示的回文串的长度。
考虑到回文串两边一样的,定义转移 c c c表示当前串左右各加上一个 c c c
因为分奇回文和偶回文,所以定义两个初始节点 0 , 1 0,1 0,1,其中 l e n [ 0 ] = 0 , l e n [ 1 ] = − 1 len[0]=0,len[1]=-1 len[0]=0,len[1]=−1(让 l e n [ 1 ] = − 1 len[1]=-1 len[1]=−1可以说是这个算法最妙的地方)
0 0 0表示偶回文, 1 1 1表示奇回文。 − 1 -1 −1可以看做添加时吞掉一个字符。
类比
A
C
AC
AC自动机,定义
f
a
i
l
[
i
]
fail[i]
fail[i]为这个回文串的最长非自己的回文后缀(以下简称回文真后缀)。
强行让 f a i l [ 0 ] = f a i l [ 1 ] = 1 fail[0]=fail[1]=1 fail[0]=fail[1]=1
实际上有个隐含条件:1的所有转移都到0
接下来同样考虑增量。
当我们插入 S [ i ] S[i] S[i]时,现在我们知道 S [ i − 1 ] S[i-1] S[i−1]的所有回文后缀,要求 S [ i ] S[i] S[i]的回文后缀。
我们可以从前一个点跳 f a i l fail fail,如果到某个点 p p p刚好可以前后接上 S [ i ] S[i] S[i],即 S [ i − l e n [ p ] − 1 ] = S [ i ] S[i-len[p]-1]=S[i] S[i−len[p]−1]=S[i],说明有一个 p p p到当前点的转移。
如果已经有转移了,说明这个回文串出现过,直接退出。
接下来维护 f a i l fail fail。我们发现最长回文真后缀和它本身具有相同的性质。
在之前的基础上继续跳就可以了。如果跳到某个 p p p有 S [ i ] S[i] S[i]的转移,说明 c h [ p ] [ S [ i ] ] ch[p][S[i]] ch[p][S[i]]是个回文后缀,连过去就可以了。
栗子: A A B A AABA AABA
插入 A A A
此时 l e n [ 1 ] = − 1 len[1]=-1 len[1]=−1的优势就体现出来了,因为刚好是 S [ i ] = S [ i ] S[i]=S[i] S[i]=S[i]
插入
A
A
A,依次跳到
0
,
1
0,1
0,1
插入
B
B
B
插入 A A A
实现
第一步插入的时候由于一些玄学问题, p p p的 f a i l fail fail可能接到自己身上
解决策略是先把fail算出来,再接到之前的节点后面
剩下的就很容易了
代码有点古怪,仅供参考
char s[MAXN];
int n;
int ch[MAXN][26],fail[MAXN];
int len[MAXN];
int las=1,tot=1;
void init()
{
len[1]=-1;
fail[0]=fail[1]=1;
}
void insert(int i)
{
int p=las;
while (s[i-len[p]-1]!=s[i]) p=fail[p];
if (ch[p][s[i]-'a']) return (void)(las=ch[p][s[i]-'a']);
int q=fail[p];
while (s[i-len[q]-1]!=s[i]) q=fail[q];
las=++tot;
fail[las]=ch[q][s[i]-'a'];
len[ch[p][s[i]-'a']=las]=len[p]+2;
}
运用
①每个点结尾的回文个数
即 f a i l fail fail树的深度
②本质不同的回文个数
就是状态数
好像只有这些……
想到再补吧