考虑只由’A’,’G’,’C’,’T’四种字符组成的DNF字符串 给定一个长度为k的字符串S,计算长度恰好为n的且不包含S的字符串的个数输入结果对10009取模 。
1<=k<=100
1<=n<=10000
输入:
n = 3, k = 2, S = “AT”
输出:
56
思路:字符串预处理+动态规划;
在以下代码中有两个数组next[i][j] 与dp[i][j] 分别代表了以上思路的两个处理。
首先next[i][j] 表示的是对于字符串S的预处理,其规模为n*4;
next[i][j] 表示的是当前枚举到的字符串的末尾的i个字符与S的前i个字符一样的时候,当下一个枚举到的字符是j(这里j的取值是0~4 分别代表着“A, G, C, T”)的时候,其构造的新串末尾有i个字符与S的的前i个字符一样的数量。
以上的这段话请细细体会下, 也可以通过下面的举例进行理解。
比如 S = “ATCG” next[1][0] 代表的是当前串的末尾是A现在多加一个A所以当前枚举到的串的末尾变成了AA, 与S相比其匹配数还是1;
所以: next[1][0] = 1;
同理 next[1][1] = 0;
对于S = “ATCG” next为:
1 0 0 0
1 0 0 2
1 0 3 0
1 4 0 0
有时会有重复的情况请按匹配最大值储存:例如 S = “ATCATCG”
如果当前枚举到的字符串末尾是ATCAT 下一位枚举的是C的话那么对于next[5][2] 可以等于3 也可以等于6, 这个时候按6算。
当构造出next以后 再看dp的状态转移方程。
dp[i][j] 表示当前枚举到第i个字符的时候末尾有j个元素与S的前j个元素想匹配的,满足题目要求的字符串个数(也就是说当前字符串中没有S出现的字符串个数);
此时 i 表示的是阶段(有n+1个阶段), j表示当前阶段下的状态(有K个)。
所以 dp[i+1][j] += dp[i][m] ( 0 <= m <= k) 在这里并非累加所有的,要去掉那些违反题目条件的。
最后代码如下:
#include <cstdio>
#include <cstring>
#include <string>
#include <algorithm>
#include <iostream>
using namespace std;
int n,k;
string S;
const char *agct = "AGCT";
const int maxn = 1009;
int dp[maxn][108];
int next[maxn][5];
const int MOD = 10009;
void init(){
memset(dp,0,sizeof(dp));
dp[0][0] = 1;
}
void solve(){
for (int i=0;i<k;i++){
for (int j=0;j<4;j++){
// 取S的前i个元素并在后面添加一个元素
string s = S.substr(0,i) + agct[j];
//反复删除s的第一个元素,直到s成为S的前缀
while(S.substr(0,s.length())!=s){
s = s.substr(1);
}
next[i][j] = s.length();
}
}
for (int i=0;i<n;i++){
for (int x=0;x<k;x++){
for (int j=0;j<4;j++){
int t = next[x][j];
if (t==k) continue; /* 这里就是排除违反题目条件的那个特例 */
dp[i+1][t] = (dp[i+1][t] + dp[i][x]) % MOD;
}
}
}
int ans = 0;
for (int i=0;i<k;i++)
ans = (ans + dp[n][i]) % MOD;
cout << ans << endl;
}
int main(){
while(cin>>n>>k>>S){
init();
solve();
}
}