题意
需要组成一个长度为N的字符串,要求组成的字符串每一位在这个字符串中能找到一个子字符串,这个子字符串属于一个字符串集合,这个集合有M的字符串。问有多少种组成方案。
题解
这道题很复杂,尤其是它是按子串组合来计算种类的,比如说样例给的那种情况,两个字符串相同,但是是两种不同的组合方案,所以我们计算的时候也算了两种。
如果我们按照以往的DP方案,开一个二维数组,dp[len][pos]的话,我们发现很难去表示是否完全是由集合中的子串组成的。我们考虑再加一个维度,用来表示当前尚未匹配的字符个数,只有最后匹配剩余个数为0,我们才能选用这个匹配结果。这样的话就是一个三位数组。最后一位在转移的时候我们要看这个当前字符串是否是某个字符串的后缀,如果这个字符串是后缀的话,那么就转移到0,否则转移到k+1。(这里可能会存在一个担心就是,有没有可能这段字符串只组成了后缀这一部分。但实际上我们分析一下就会发现,如果这个字符串不能组成完整的部分,我们是不能转移到那个点的,因此一旦转移到了那个点,这个字符串中一定包含完整的子串。这时候如果不需要额外的字符串,那么我们就可以消掉。)
代码
#include<bits/stdc++.h>
#define UP(i,l,h) for(int i=l;i<h;i++)
#define DOWN(i,h,l) for(int i=h-1;i>=l;i--)
#define W(a) while(a)
#define MEM(a,b) memset(a,b,sizeof(a))
#define LL long long
#define INF 0x3f3f3f3f3f3f3f3f
#define MAXN 120050
#define MOD 1000000009
#define EPS 1e-3
using namespace std;
const int C=4;
char st[20];
int ch[120][C],f[120],tmp[120][C];
int dp[1010][120][12];
int sz;
int last[120];
int getNum(int a){
switch(a){
case 'A':return 0;
case 'C':return 1;
case 'G':return 2;
case 'T':return 3;
}
}
void insert(){
int len=strlen(st);
int u=0;
UP(i,0,len){
int x=getNum(st[i]);
if(!ch[u][x]){
ch[u][x]=sz++;
}
u=ch[u][x];
}
last[u]=len;
// cout<<u<<" "<<last[u]<<" "<<len<<endl;
}
void getFail(){
queue<int> q;
f[0]=0;
UP(i,0,C) if(ch[0][i]) q.push(ch[0][i]);
W(!q.empty()){
int r=q.front();
q.pop();
UP(x,0,C){
int u=ch[r][x];
if(!u){
ch[r][x]=ch[f[r]][x];
continue;
}
q.push(u);
int v=f[r];
f[u]=ch[v][x];
last[u]=max(last[f[u]],last[u]);
// cout<<last[u]<<endl;
}
}
}
int main(){
MEM(ch,0);
MEM(last,0);
sz=1;
int n,m;
scanf("%d%d",&n,&m);
UP(i,0,m){
scanf("%s",st);
insert();
}
memcpy(tmp,ch,sizeof(ch));
getFail();
MEM(dp,0);
dp[0][0][0]=1;
UP(i,0,n){
UP(j,0,sz){
UP(k,0,10){
UP(c,0,C){
int v=ch[j][c];
if(last[v]>k) dp[i+1][v][0]=(dp[i+1][v][0]+dp[i][j][k])%MOD;
else dp[i+1][v][k+1]=(dp[i+1][v][k+1]+dp[i][j][k])%MOD;
}
}
}
}
int ans=0;
UP(i,0,sz){
ans=(ans+dp[n][i][0])%MOD;
}
printf("%d\n",ans);
}