题目大意
给定一个长度为n的只包含前K个小写字母的字符串,现在要在它后面补上m个前K个小写字母,求能得到的最多的不同的子序列个数(空串也算),答案对109+7取模.
n,m≤105,K≤26.
题解
我们先考虑怎么求一个给定字符串的不同子序列个数.
关键是dp时怎么保证不重复计数?
呃…说实话我只是自己瞎定义了一个状态,然后发现可以通过奇妙的转移避免重复计算,所以我也无法很好地解释思路究竟是怎样的(=.=||).
设dp[i][j]表示从前i个字符中取出的结尾为字符j的方案数.可以写出转移方程:
显然若str[i]≠j,那么dp[i][j]=dp[i−1][j].
而对str[i]=j的情况,有:
dp[i][j]=∑kdp[i−1][k]+1.
即在前面所有的方案后面都加上一个str[i],还算上一种只取str[i]的方案.
这样转移就保证了每个dp值表示的所有方案中没有重复的,而在结尾不同的方案后面接上str[i]也不会有重复,从而避免了重复计数.加上空串后最终答案为∑dp[n][i]+1.
于是维护一个dp值之和就可以O(n)求出给定串的不同子序列个数.当然dp的第一维可以省掉.
然而接下来的m个字符需要我们自己构造,只要写出上面的dp方程就不难了.
容易发现在前面的dp值确定的情况下不管怎么构造得到的dp值都是不变的,而改变的只是dp值之和.所以可以贪心地选dp值最小的进行构造.
注意还有一点是这里的dp值是取模过的,所以不能直接比较大小,可以发现dp值显然是单调递增的,所以可以机智地用下标进行比较.
复杂度是O(n+m⋅K).
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e6+5,MAX_K=26,P=1e9+7;
int last[MAX_K],dp[MAX_K];
char str[N];
inline void mod_add(int &a,int b){
if((a+=b)>=P)a-=P;
}
int main(){
int n,m,K,sum=0,ans=1;
scanf("%d%d%s",&m,&K,str);
n=strlen(str);
for(int i=0;i<K;++i){
dp[i]=0;
last[i]=-1;
}
for(int i=0;i<n;++i){
last[str[i]-='a']=i;
int tmp=dp[str[i]];
dp[str[i]]=(sum+1)%P;
sum=(((sum<<1)+1-tmp)%P+P)%P;
}
for(int i=0;i<m;++i){
int ptr=-1;
for(int j=0;j<K;++j)
if(ptr==-1||last[j]<last[ptr])ptr=j;
int tmp=dp[ptr];
dp[ptr]=(sum+1)%P;
sum=(((sum<<1)+1-tmp)%P+P)%P;
last[ptr]=n+i;
}
for(int i=0;i<K;++i)
mod_add(ans,dp[i]);
printf("%d\n",ans);
return 0;
}
/*
*/
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e6+5,MAX_K=26,P=1e9+7;
int last[MAX_K],dp[MAX_K];
char str[N];
inline void mod_add(int &a,int b){
if((a+=b)>=P)a-=P;
}
int main(){
int n,m,K,sum=0,ans=1;
scanf("%d%d%s",&m,&K,str);
n=strlen(str);
for(int i=0;i<K;++i){
dp[i]=0;
last[i]=-1;
}
for(int i=0;i<n;++i){
last[str[i]-='a']=i;
int tmp=dp[str[i]];
dp[str[i]]=(sum+1)%P;
sum=(((sum<<1)+1-tmp)%P+P)%P;
}
for(int i=0;i<m;++i){
int ptr=-1;
for(int j=0;j<K;++j)
if(ptr==-1||last[j]<last[ptr])ptr=j;
int tmp=dp[ptr];
dp[ptr]=(sum+1)%P;
sum=(((sum<<1)+1-tmp)%P+P)%P;
last[ptr]=n+i;
}
for(int i=0;i<K;++i)
mod_add(ans,dp[i]);
printf("%d\n",ans);
return 0;
}
/*
*/