给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串?
输入格式:
输入在一行中给出全部由小写英文字母组成的、长度在区间 [4, 106] 内的字符串。
输出格式:
在一行中输出至多删掉其中 3 个字符后不同字符串的个数。
输入样例:
ababcc
输出样例:
25
提示:
删掉 0 个字符得到 "ababcc"。
删掉 1 个字符得到 "babcc", "aabcc", "abbcc", "abacc" 和 "ababc"。
删掉 2 个字符得到 "abcc", "bbcc", "bacc", "babc", "aacc", "aabc", "abbc", "abac" 和 "abab"。
删掉 3 个字符得到 "abc", "bcc", "acc", "bbc", "bac", "bab", "aac", "aab", "abb" 和 "aba"。
思路&解析
如果不考虑重复的情况下,我们可以得到DP的转移方程
dp[x][y] --> 前x个字符删去y个字符得到的方案数 dp[i][j] = dp[i - 1][j];//不删第i个字符 if(j) dp[i][j] += dp[i - 1][j - 1];//删第i个字符
这个DP转移是很容易的得到的
但我们同时也不得不考虑重复的问题
举个例子
abcded
dp[6][2] 时我们删除"de" or "ed" 得到的答案是一样的,所以我们多计算了一次,
多计算的正是dp[3][0]
if(s[k]==s[i]) { dp[i][j] -= dp[k-1][j-(i-k)]; //[j-(i-k)]表示 i 到 k-1 删了几个字符 break; }
如果我们可以找到第i个位置的前面 k 的位置有与i相同的字符(简单的说,i与k位置上的字符相同)
这就找到了可能会重复的情况(注意是可能会重复,"abcdea"像这样的就不会重复,因为我们之多删除3个字符)
首先我们可以知道减去的一定在dp[x-1][....] (就是在前x-1的位置下进行删除)
[....]应该是什么呢?
不能发现应该是 [j-(i-k)]
为什么呢?
本身这个位置上就代表要删除的字符数,(i-k) 是指 i 到 k-1 删了多少个字符
通过转移我们可以知道dp[...][j] 是可以通过 dp[...][j-(i-k)]转移过来的,所以dp[...][j-(i-k)]就正是多加的那一部分。
去重 我们就减去那一部分就ok了
ps:
去重这个还是比较绕的,本人也是研究了很长时间,建议从DP转移出发 想是多加了哪一部分,并且还可以结合样例去理解这个去重!
AC代码:
#include <bits/stdc++.h>
using namespace std;
#define ll long long
const int N = 1e6 + 9;
ll dp[N][5];
char s[N];
int main()
{
cin >> (s+1);
int n = strlen(s+1);
dp[0][0] = 1;
for (int i = 1; i <= n; i++)
{
for (int j = 0; j <= 3; j++)
{
dp[i][j] = dp[i - 1][j];
if(j)
dp[i][j] += dp[i - 1][j - 1];
for(int k = i-1;k>=1&&(i-k)<=j;k--)
{
if(s[k]==s[i])
{
dp[i][j] -= dp[k-1][j-(i-k)];
//[j-(i-k)] k-1 删了几个字符
break;
}
}
}
}
ll ans = 0;
for(int i = 0;i<=3;i++)
ans += dp[n][i];
cout<<ans<<"\n";
}