题目:给定一个长为k的字符串S,判断长为n的字符串中不包含S的字符串的个数。
如果直接枚举是
4n
4
n
个字符串 显然不行
于是看出其实每次添加最后一个字符时,是否会新包含一个S只和最后
k−1
k
−
1
个字符有关
但是这样仍然有
4k−1
4
k
−
1
种状态
但是仔细看一下,发现如果和S不匹配的话,什么字符都是没区别的。
比如如果S=“ATCG“ 那么“TTA“和“CCA“没区别。
那么其实可以直接把新字符串的后缀和原字符串的匹配作为状态 这样状态数就变为
k
k
个
但是如果原字符串本身包含了重复的字符,那么就是最长的匹配
于是就可解了!
写的时候先预处理出从某个状态添加某个字符的新状态表
这样预处理的复杂度是 DP的复杂度是
O(kn)
O
(
k
n
)
代码:
#include<iostream>
#include<cstdio>
using namespace std;
const char *AGCT = "AGCT";
const int MOD =10009;
const int MAX_K = 105;
const int MAX_N = 10005;
int N,K;
string S;
int next[MAX_K][4];
int dp[MAX_N+1][MAX_K];
void solve()
{
for (int i = 0; i < K; i++)
{
for (int j = 0; j < 4; j++)
{
string s = S.substr(0,i) + AGCT[j];
while (S.substr(0, s.length()) != s)
{
s = s.substr(1);
}
next[i][j] = s.length();
}
}
dp[0][0] = 1;
for (int i = 1; i < K; i++) dp[0][i]=0;
for (int t = 0; t < N; t++) {
for (int i = 0; i < K; i++) dp[t + 1][i]=0;
for (int i = 0; i < K; i++) {
for (int j = 0; j < 4; j++) {
int ti = next[i][j];
if (ti == K) continue;
dp[t + 1][ti] = (dp[t + 1][ti] + dp[t][i]) % MOD;
}
}
}
int ans = 0;
for (int i = 0; i < K; i++) ans = (ans + dp[N][i]) % MOD;
printf("%d\n", ans);
}
int main()
{
scanf("%d%d",&N,&K);
scanf("%s",S);
solve();
return 0;
}