[ABC214F]Substrings

最新推荐文章于 2023-03-17 18:45:10 发布

OneInDark

最新推荐文章于 2023-03-17 18:45:10 发布

阅读量263

点赞数

分类专栏： C++ 动态规划字符串

本文链接：https://blog.csdn.net/qq_42101694/article/details/119780478

版权

C++ 同时被 3 个专栏收录

547 篇文章 3 订阅

订阅专栏

动态规划

220 篇文章 2 订阅

订阅专栏

字符串

38 篇文章 0 订阅

订阅专栏

题目

传送门 to AtCoder

思路

我的方法

我的思路比较简单，就是直接计算出每个前缀中，用这种方法得到的不同字符串数量。

那么前缀 $i$ 可生成的字符串集合 $S_i$ 有两类：一种是使用了第 $i$ 个字符，形如 $S_{i-2}+c$ ，另一种不使用第 $i$ 个字符，即 $S_{i-1}$ 。

显然同一类内，字符串不相同，所以只需要算二者的交集，即：有多少个 $S_{i-1}$ 内的字符串，是以字符 $c$ 结尾，且去掉字符 $c$ 之后属于 $S_{i-2}$ 的？

仔细一想，如果第 $i - 1$ 个字符不是 $c$ ，那么这就是铁定的，因为以 $c$ 结尾的字符串整个都属于 $S_{i-2}$ 了；哪怕第 $i - 1$ 个字符是 $c$ ，并且 $S_{i-1}$ 中的字符串使用了它，将其去掉也就变为 $S_{i-3}\subseteqq S_{i-2}$ 了。

这就是说：对于以第 $i$ 个字符结尾的 $l e n > 1$ 的字符串，它必然是由前缀 $i - 2$ 产生的任意字符串拼接上该字符；其余字符结尾，都可以简单地从 $S_{i-1}$ 直接拷贝而来。

那么便用 $f (i, c)$ 表示前缀 $i$ 生成的以字符 $c$ 结尾的字符串数量。若当前字符为 $c_0$ ，则
$f(i,c_0)=1+\sum_{c\in\sigma}f(i-2,c)$

其中 $\sigma$ 表示字符集。其余的则是 $f(i,c)=f(i-1,c)\;(c\ne c_0)$ 。这就是一个简单的 $\mathcal O(|\sigma|n)$ 的 $\tt dp$ 了。

看看题解，可以是 $\mathcal O(n)$ 的！好，开始优化。发现每次只会修改一个位置，并且是利用 $i - 2$ 的总和。只需存储 $last=\sum_{c\in\sigma}f(i-1,c)$ 和 $now=\sum_{c\in\sigma}f(i,c)$ ，同时把 $f (i, c)$ 这个长度为 $\mathcal O(|\sigma|)$ 的数组存下来。这样就是 $\mathcal O(1)$ 转移了！

官方题解

这个做法其实本质上就来源于：序列自动机。在 $\rm OI\;wiki$ 上了解它一下就行了。

于是可以考虑，有多少个子序列是刚好匹配到第 $i$ 个状态。显然最后一个字符是字符串的第 $i$ 个字符，并且需要不能走到更靠前的一个，记 $k\;(k<i)$ 为最靠近 $i$ 的相同字符的位置，则
$g(i)=\sum_{j=k-1}^{i-2}g(j)$

然后答案就是 $\sum_{i=1}^{n}g(i)$ 了。前缀和优化一下就是 $\mathcal O(n)$ 的。

初值为 $g (0) = 1$ 么？不完全是。因为我们要选择的字符不能相邻。 $0$ 相当于一个虚点，这样会忽略掉第一个字符，所以正确的赋值是 $g (- 1) = 1$ 。实现的时候可以先赋值 $g (1) = 1$ ，然后 $k = 0$ 再额外补上这玩意儿。

代码

我的实现

#include <cstdio>
#include <iostream>
#include <cstring>
using namespace std;
typedef long long int_;
# define rep(i,a,b) for(int i=(a); i<=(b); ++i)
# define drep(i,a,b) for(int i=(a); i>=(b); --i)
inline int readint(){
	int a = 0; char c = getchar(), f = 1;
	for(; c<'0'||c>'9'; c=getchar())
		if(c == '-') f = -f;
	for(; '0'<=c&&c<='9'; c=getchar())
		a = (a<<3)+(a<<1)+(c^48);
	return a*f;
}

const int MaxN = 200005;
const int Mod = 1e9+7;
int dp[MaxN]; char s[MaxN];

int main(){
	scanf("%s",s+1);
	int n = strlen(s+1);
	if(n == 1) return puts("1")*0;
	dp[s[1]-'a'] = 1;
	int lst = 1, now = 1;
	if(s[1] != s[2]){
		dp[s[2]-'a'] = 1;
		now = 2; // how many
	}
	rep(i,3,n){
		int nv = now-dp[s[i]-'a'];
		nv = (nv+lst+1)%Mod;
		if(nv < 0) nv += Mod;
		dp[s[i]-'a'] = lst+1;
		lst = now, now = nv;
	}
	printf("%d\n",now);
	return 0;
}

官方题解

#include <cstdio>
#include <iostream>
#include <cstring>
using namespace std;
typedef long long int_;
# define rep(i,a,b) for(int i=(a); i<=(b); ++i)
# define drep(i,a,b) for(int i=(a); i>=(b); --i)
inline int readint(){
	int a = 0; char c = getchar(), f = 1;
	for(; c<'0'||c>'9'; c=getchar())
		if(c == '-') f = -f;
	for(; '0'<=c&&c<='9'; c=getchar())
		a = (a<<3)+(a<<1)+(c^48);
	return a*f;
}

const int Mod = 1e9+7;
const int MaxN = 200005;
char s[MaxN];
int lst[MaxN], dp[MaxN];

int main(){
	scanf("%s",s+1);
	int n = strlen(s+1);
	dp[1] = lst[s[1]] = 1;
	rep(i,2,n){
		int &p = lst[s[i]];
		dp[i] = dp[i-2];
		if(p >= 2)
			dp[i] -= dp[p-2];
		else if(!p) ++ dp[i];
		dp[p = i] = (dp[i]+Mod)%Mod;
		// get prefix sum
		dp[i] = (dp[i]+dp[i-1])%Mod;
	}
	printf("%d\n",dp[n]);
	return 0;
}