题目
给定一个全部由小写英文字母组成的字符串,至多删掉其中 3 个字符,结果可能有多少种不同的字符串?长度在 [ 4 , 1 0 6 ] [4, 10^{6}] [4,106]内。
输入样例
ababcc
输出样例
25
思路:
状态
d
p
[
i
]
[
j
]
dp[i][j]
dp[i][j]表示判断到了第
i
i
i 个字符,已删除
j
j
j 个。
对
i
i
i 这个点,无非两种情况,删与不删,可写出状态转移方程
d
p
[
i
]
[
j
]
=
d
p
[
i
−
1
]
[
j
]
+
d
p
[
i
−
1
]
[
j
−
1
]
dp[i][j] = dp[i-1][j] + dp[i-1][j-1]
dp[i][j]=dp[i−1][j]+dp[i−1][j−1]
一开始我也是简简单单提交,没考虑这么多。仔细一想,dp的状态最忌讳有重叠的,可喜的是重叠的部分已经在前面被dp出来了。
比如 abcxxxxc,删第三个x和第四个x是一样的,我这里没有举例删第二个x和第四个是一样的,这样留下的字符串就不连续了,这样就不能归约为我定的dp状态了,所以要从位置
i
i
i开始从前连续的(长度不超过
j
j
j 个里面)找第一个相同的。截掉了
x
x
x 个,前半部分还要截
j
−
x
j - x
j−x 个。
坑点
- 线性dp,更新方向是从左到右,从上到下, i i i下标从 1 1 1开始 ,讨论比较方便,因此采用了scanf读入。
- 最后的答案规模到了long long 级别!!!开int范围最后三个样例过不了。(别问我是怎么知道,问就是度娘,如果路过的知道,欢迎留言)
#include<bits/stdc++.h>
using namespace std;
const int N = 1e6+10;
typedef long long ll;
char s[N];
ll f[N][4];
int main()
{
scanf("%s", s+1);
int n = strlen(s + 1);
for (int i = 0; i <= n; i++)// j=0的情况初始好,避免下面j-1越界
f[i][0] = 1;
for (int i = 1; i <= n; i++)
{
for (int j = 1; j <= 3; j++)
{
f[i][j] = f[i-1][j] +f[i-1][j-1];
for (int k = i - 1; k >= 1 && k >= i - j; k--)
{
if (s[k] == s[i])
{
f[i][j] -= f[k - 1][j - i + k];
break;
}
}
}
}
printf("%lld\n", f[n][0] + f[n][1] + f[n][2] + f[n][3]);
return 0;
}