[CF932G]Palindrome Partition

最新推荐文章于 2021-03-01 16:57:41 发布

OneInDark

最新推荐文章于 2021-03-01 16:57:41 发布

阅读量167

点赞数

分类专栏：字符串 # PAM 动态规划

本文链接：https://blog.csdn.net/qq_42101694/article/details/112546616

版权

动态规划同时被 3 个专栏收录

220 篇文章 2 订阅

订阅专栏

字符串

38 篇文章 0 订阅

订阅专栏

PAM

2 篇文章 0 订阅

订阅专栏

题目

传送门 to luogu

思路

可以看看 $\tt yyb$ 大佬的博客。如果你直接觉得 “ 没问题！简单！” 那就不用看这篇博客了 😉

第一步，令 $S'=S_1S_nS_2S_{n-1}S_3S_{n-2}\dots S_{\frac{n}{2}}S_{\frac{n}{2}+1}$ ，那么问题转化为，将 $S^{'}$ 划分为若干个偶数长度的回文串。~~这个构造请自己手推。~~

用 $f (x)$ 表示长度为 $x$ 的前缀的划分方案数。建立回文自动机之后，不难想到 $\mathcal O(n^2)$ 的暴力跳 $f a i l$ 的转移。为了让 “ 偶数长度 ” 这个奇怪的限制滚蛋，直接令 $f (2 x + 1) = 0$ 就可以无差别转移了。

第二步，由于转移只是单纯的 $\sum f$ ，可以考虑用 $g$ 存储一段 $d i f (x) = l e n (x) - l e n (f a i l)$ 相等的点。

然而，这一步有问题了！那就是， $g$ 到底代表哪些 $f$ 的和？因为字符串的右端点是在改变的！

我的理解是，事实上 $g(x)=\sum_{k}f[\omega-1+k\;dif(x)]$ ，其中 $\omega$ 是该字符串 最后一次出现 的左端点位置。而 $k$ 的范围是什么呢？当然是 “ $d i f$ 等值链 ” 的长度。

此时重新考虑这个问题。加入一个字符，会影响哪些 $g$ 的值呢？也就是 $\omega$ 什么时候会变？显然是后缀。那么我们只要把新点 $f a i l$ 链上的 $g$ 更新了即可！

好，我们继续。怎么转移 $g$ 呢？考虑 $f a i l (x)$ 的 $g$ 是哪些 $f$ 。~~众所周知~~，对于一个回文自动机，新产生的后缀串 $S t r (f a i l (x))$ ，如果长度不小于 $\frac{len(x)}{2}$ ，其最后一次出现恰好是将其用 $S t r (x)$ 翻转后的结果！

这个东西挺好证。首先，用 $S t r (x)$ 将其翻转后结果必然是一次出现。其次，如果它有更靠后的出现，那么这两个串取并也是一个回文串，与 $f a i l (x)$ 是最长的回文后缀冲突。

要不咱还是画个图？~~虽然是用代码块的像素风。~~

Str(x):                   ------xxxxxxxxxx
Str(fail):                ---------xxxxxxx
REVERSE, Str(fail):       ------xxxxxxx---
if Str(fail):             -------xxxxxxx--
then Str(?):              -------xxxxxxxxx

不难验证，上图中的 $S t r (?)$ 是一个回文串，它是由别的 $S t r (f a i l)$ （我们假设的一个，在 if 语句中的）和后缀 $S t r (f a i l)$ 拼接而成的。如果它真的存在，它肯定会成为 $f a i l$ ，因为它更长。

既然这个结论成立，那么我们的更新就可以变的骚一点。先记 $g (x)$ 恰好管不着的那个点为 $t o p (x)$ （确实很像链剖分）。如果 $t o p (x) = f a i l (x)$ ，直接更新即可（因为此时 $g$ 只能管自己的值）。否则， $dif(x)<\frac{len(x)}{2}$ ，毕竟 $d i f [f a i l (x)] = d i f (x)$ 嘛，跳两下父节点的话，长度要变小 $2\;dif(x)$ 的。

于是， $len[fail(x)]>\frac{len(x)}{2}$ ，恰好满足我们上面的结论触发条件。所以 $f a i l (x)$ 和 $x$ 都满足 $\omega=n-len(x)+1$ 。那么 $g [f a i l (x)]$ 和 $g (x)$ 的唯一差别就只在于定义式中 $k$ 的范围。显然 $x$ 对应的 $k$ 的范围比 $f a i l (x)$ 的大 $1$ 。直接加上这个差异点 $f [n - l e n (t o p) - d i f]$ 即可。

用行中公式写一下： $g (x) = g [f a i l (x)] + f [n - l e n (t o p) - d i f]$

如果你没有看懂上面这段话！请看 $\tt llsw$ 题解中的最后一张图片。
$Extra\;Explanation$ ：为啥差异点是那个玩意儿？因为 $g (x)$ 恰好管不着的位置是 $n - l e n (t o p)$ 嘛，往回退一步就是管的到的。

所以，只要 $f a i l (x)$ 信息正确，就可以求出 $g (x)$ 。~~这么显然应该不用加粗才对。~~

可是这样仍然是 $\mathcal O(n^2)$ 的，因为整条链的 $g$ 都要被修改……

给出骚操作：每次更新，只更新 “ $d i f$ 等值链 ” 的交界处 和当前点（目前的整个串的最长回文后缀）。这样就足以保证正确性。

怎么想到的？不知道。但是正确性容易证明。考虑没有被及时更新的点，其本质是 $dif(x)=dif(son_x)$ （虽然并没有 $s o n$ 这个数组，意会就好），否则就会成为链的交界处。

假设我们正在更新 $g (y)$ 。考虑一下， $g [f a i l (y)]$ 是不是在我们想要的 $n - d i f (y)$ 处更新了呢？不妨用反证法，假设当初它没有被更新，因为它被子节点 $x$ 跳了过去，满足 $f a i l (x) = f a i l (y)$ 且 $d i f (x) = d i f [f a i l (x)]$ 。

首先你要意识到， $d i f$ 就是周期，因为 $f a i l$ 就是 $\rm border$ 。有了这一点，你就会意识到 $d i f$ 在 $f a i l$ 链上是单减的（不然周期不会变）。由于我们要更新 $y$ ，所以 $dif(son_y)>dif(y)$ 。

并且，因为 $d i f$ 是周期，所以 $S t r (x)$ 一定是 $S t r [f a i l (x)]$ 前面加上一个周期（一定是完整的周期）得到的结果。而我们知道， $S t r [f a i l (x)]$ 当初的右端点为 $n - d i f (y)$ ，恰好是 $S t r (y)$ 去掉从右边开始数的一个周期（尽管可能不是所谓的完整周期，但是确实为一个周期的长度），所以 $\color{black}Str(x)=Str(y)$ 。

还是 ~~用代码块风格~~ 画一张图。要想到这一点： $f a i l$ 只跟这个节点本身有关，所以无论右端点怎么变， $f a i l$ 不变，进而 $d i f$ 也不变。因为 $f a i l (y)$ 的 $d i f$ 不变，所以导致它被跳过的 $x$ 也就固定了。

.............. : son(y) (whatever string)
   abababababa : y (dif vary, so it's processed)
     ababababa : fail(y)
       abababa : fail(fail(y)) (just to show dif = 2)
   ababababa   : expected fail(y)
 abababababa   : x, who caused skip on fail(y)
 ababababababa : x∪y, who should be fail(son(y))

显然 $S t r (x)$ 和 $S t r (y)$ 相交，所以二者的并也是回文串。不难发现这是从 $n - d i f (y) - l e n (y) + 1$ 到 $n$ 的。然鹅， $dif(son_y)>dif(y)\Rightarrow len(son_y)>len(y)+dif(y)$ ，所以这个新回文串仍然包含在 $son_y$ 以内。也就是说！在 $Str(son_y)$ 内！有一个比 $f a i l$ 更长的回文后缀！矛盾！

当然，你会说，如果 $y$ 是当前点而寻求更新呢？不一定满足 $dif(son_y)>dif(y)$ 了吧（因为根本没有子节点）？然而这种情况 $S t r (x) = S t r (y)$ 是仍然成立的。怎么可能新加入的点代表一个已经存在的字符串呢？

总结：虽然我们的更新不完全，但它足以应付我们需要用到的 $g$ 了。

时间复杂度呢？由于 $d i f$ 是 $\rm border$ ，所以一定要 $len\le dif$ 时才能切换一个 $d i f$ 。这个分析就跟辗转相除一样了：如果 $d i f$ 不超过 $\frac{len}{2}$ ，那么余数自然不能超过 $d i f$ ；而 $d i f$ 超过一半长度时，一步到位。最多跳 $\mathcal O(\log n)$ 次。

代码

#include <cstdio>
#include <iostream>
#include <cstring>
using namespace std;
inline int readint(){
	int a = 0; char c = getchar(), f = 1;
	for(; c<'0'||c>'9'; c=getchar())
		if(c == '-') f = -f;
	for(; '0'<=c&&c<='9'; c=getchar())
		a = (a<<3)+(a<<1)+(c^48);
	return a*f;
}

const int Mod = 1e9+7;
const int MaxN = 1000005;
const int CharSiz = 26;

int f[MaxN], g[MaxN];
namespace PAM{
	int ch[MaxN][CharSiz];
	int fail[MaxN], cntNode = 1;
	char item[MaxN]; int len[MaxN];
	int n = 0, lst = 1, top[MaxN];
	void init(){
		++ cntNode; // include 0
		memset(ch,0,cntNode*CharSiz<<2);
		memset(fail,0,cntNode<<2);
		n = 0, cntNode = lst = 1;
		fail[0] = fail[1] = 1;
		len[1] = item[0] = -1;
	}
	void add(char c){
		item[++ n] = c; int x = lst;
		while(item[n-len[x]-1] != item[n])
			x = fail[x]; // find it
		int now = ch[x][c];
		if(now == 0){
			now = ++ cntNode; // new node
			int &p = fail[now] = fail[x];
			while(item[n-len[p]-1] != item[n])
				p = fail[p]; // find it
			p = ch[p][c]; // add char c
			ch[x][c] = now; // last step
			len[now] = len[x]+2;
			if((len[fail[now]]<<1) ==
			len[now]+len[fail[fail[now]]])
				top[now] = top[fail[now]];
			else top[now] = fail[now];
		}
		lst = now; // update lst
	}
	void solve(){
		int p = lst;
		for(; p&&p!=1; p=top[p]){
			int dif = len[p]-len[fail[p]];
			g[p] = f[n-len[top[p]]-dif];
			if(fail[p] != top[p])
				g[p] = (g[p]+g[fail[p]])%Mod;
			if(!(n&1)) f[n] = (f[n]+g[p])%Mod;
		}
	}
}

char xez[MaxN], tmp[MaxN];
int main(){
	scanf("%s",tmp);
	int zxy = strlen(tmp);
	for(int i=0; (i<<1)<zxy; ++i)
		xez[i<<1] = tmp[i];
	for(int i=0; (i<<1|1)<zxy; ++i)
		xez[i<<1|1] = tmp[zxy-1-i];
	PAM::init(), f[0] = 1;
	for(int i=0; i<zxy; ++i){
		PAM::add(xez[i]-'a');
		PAM::solve();
	}
	printf("%d\n",f[PAM::n]);
	return 0;
}