Description
基因串是由ACGT4个字母组成的,我们有一个长度为n的基因串S。想要知道长度为m的基因串A中,与S的最长公共子序列分别为0,1,2…..n的串各有几个。
输出答案关于10^9 + 7的余数。
100%的数据n <= 10,m <= 1000。
Analysis
我们知道,LCS的dp方程长这样:
f[i][j]=max(f[i][j−1],f[i−1][j],f[i−1][j−1]+1 [a[i]==b[j]]);
直接dp肯定是不好做的,因为你不知道组成lcs的是哪些
关注到n<=10,考虑状压?
F[i][s]
表示A到i,集合
{f[i][1],f[i][2]......f[i][10]}
的状态为s的方案数
那么是可以dp的,但是,集合s的大小为10^10,显然承受不了
解决方法是一种Trick,在dp里面很常用:
f[i][j−1]<=f[i][j]<=f[i][j−1]+1
在集合s里面做差,那么集合的大小就变成了2^10
枚举状态,转移的时候还原状态,再压缩状态更新
Code
#include<cstdio>
#include<cstring>
#include<algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
using namespace std;
const int N=11,mo=1e9+7;
int n,m,_2[N],a[N],b[N],c[N],ans[N],f[1005][1030];
char s[N];
int main()
{
_2[0]=1;
fo(i,1,10) _2[i]=_2[i-1]*2;
scanf("%s\n%d",s+1,&m);
n=strlen(s+1);
fo(i,1,n)
{
if(s[i]=='A') a[i]=1;
if(s[i]=='C') a[i]=2;
if(s[i]=='G') a[i]=3;
if(s[i]=='T') a[i]=4;
}
f[0][0]=1;
fo(i,0,m)
fo(j,0,_2[n]-1)
if(f[i][j])
{
fo(k,1,n) b[k]=b[k-1]+((j&_2[k-1])?1:0);
fo(p,1,4)
{
int ss=0;
fo(k,1,n)
{
c[k]=max(c[k-1],b[k]);
if(p==a[k]) c[k]=b[k-1]+1;
ss=ss+(c[k]-c[k-1])*_2[k-1];
}
(f[i+1][ss]+=f[i][j])%=mo;
}
}
fo(j,0,_2[n]-1)
{
fo(k,1,n) b[n-k+1]=((j&_2[k-1])?1:0);
fo(k,1,n) b[k]+=b[k-1];
(ans[b[n]]+=f[m][j])%=mo;
}
fo(i,0,n) printf("%d\n",ans[i]);
return 0;
}