L3-2 至多删三个字符(30 分)
给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中 3 个字符,结果可能有多少种不同的字符串?
输入格式:
输入在一行中给出全部由小写英文字母组成的、长度在区间 [4, 10^6] 内的字符串。
输出格式:
在一行中输出至多删掉其中 3 个字符后不同字符串的个数。
输入样例:
ababcc
输出样例:
25
提示:
删掉 0 个字符得到 "ababcc"。
删掉 1 个字符得到 "babcc", "aabcc", "abbcc", "abacc" 和 "ababc"。
删掉 2 个字符得到 "abcc", "bbcc", "bacc", "babc", "aacc", "aabc", "abbc", "abac" 和 "abab"。
删掉 3 个字符得到 "abc", "bcc", "acc", "bbc", "bac", "bab", "aac", "aab", "abb" 和 "aba"。
思路:d[i][j]表示前i个字符中删除j个字符后得到的不同字符串的个数。则
d[i][j+1]+=d[i-1][j](删除第i个字符)
d[i][j]+=d[i-1][j](不删除第i个字符)
如果只是这样转移肯定会有重复的。例如一个字符串cdabnaxy,你删除abn和删除bna后得到的字符串都是cdaxy。
这时候就要去重了,根据上面那个栗子可以发现对于一个字符s[i],如果在i之前存在一个x使得s[x]=s[i],那么删除[x,i-1]间的字符 和删除[x+1,i]间的字符其实是重复的,等价的,那么d[i][j]就要减去d[x-1][j-(i-x)],减去删除这段造成的重复串。
#include<bits/stdc++.h>
using namespace std;
const int MAX=1e6+5;
typedef long long ll;
char s[MAX];
ll d[MAX][4];
int main()
{
scanf("%s",s+1);
int n=strlen(s+1);
d[0][0]=1;
for(int i=1;i<=n;i++)
{
for(int j=0;j<=3;j++)
{
if(d[i-1][j]==0)continue;
if(j<3)d[i][j+1]+=d[i-1][j];
d[i][j]+=d[i-1][j];
for(int k=i-1;k>=1&&i-k<=j;k--)//往前找到第一个k使得s[k]=s[i]
{
if(s[k]==s[i])
{
d[i][j]-=d[k-1][j-(i-k)];
break;
}
}
}
}
printf("%lld\n",d[n][0]+d[n][1]+d[n][2]+d[n][3]);
return 0;
}