做DP题关键的第一步就是确定状态,上来状态错了,这题百分之八九十就没法做了,其实就那几个关键的变量,我上来一般是凭直觉确定状态,卡住了的话,取一两个变量代入试试咯。
这个题一开始状态的确定卡了一下。。。
思路:设dp[i][j] 为i个人,Tomato 在第j个位置时达到目标状态的概率。
那么j的取值要分为三种情况。
dp[i][1] = p[1]*dp[i][1] + p[2]*dp[i][i] + p[4];(j = 1)
dp[i][j] = p[1]*dp[i][j] + p[2]*dp[i][j-1] + p[3]*dp[i-1][j-1] + p[4];(2 <= j <= k)
dp[i][j] = p[1]*dp[i][j] + p[2]*dp[i][j-1] + p[3]*dp[i-1][j-1];(k+1 <= j <= i)
这个题最关键的是怎么解方程。可以发现,如果dp数组中i-1行的各个值都已知的话,dp[i][j]可以写成A*dp[i][1] + B的形式。
又因为dp[i][1] 可以用dp[i][i]表示,所以联立可解dp[i][1]。这样dp[i][j]都可以求解了。
我的代码:
#include<cstdio>
#include<iostream>
#include<cstring>
#include<cmath>
#include<cstdlib>
using namespace std;
const int maxn = 2005;
const double eps = 1e-8;
int n,m,k;
double p[5];
double dp[maxn][maxn];
double A[maxn],B[maxn];
void solve(){
if(fabs(p[4]) < eps) {printf("0.00000\n");return;}
dp[1][1] = p[4] / (1 - p[1] - p[2]);
for(int i = 2; i <= n ; i++){
A[1] = 1;B[1] = 0;
for(int j = 2; j <= k && j <= i ; j++){
A[j] = A[j-1] * p[2] / (1 - p[1]);
B[j] = B[j-1] * p[2] / (1 - p[1]) + p[3] * dp[i-1][j-1] / (1 - p[1]) + p[4] / (1 - p[1]);
}
for(int j = k+1; j <= i ; j++){
A[j] = A[j-1] * p[2] / (1 - p[1]);
B[j] = B[j-1] * p[2] / (1 - p[1]) + p[3] * dp[i-1][j-1] / (1 - p[1]);
}
dp[i][1] = (B[i] * p[2] + p[4]) / (1 - p[1] - A[i] * p[2]);
for(int j = 2 ; j <= i ; j++)
dp[i][j] = A[j] * dp[i][1] + B[j];
}
printf("%.5f\n",dp[n][m]);
}
int main(){
while(~scanf("%d%d%d%lf%lf%lf%lf",&n,&m,&k,&p[1],&p[2],&p[3],&p[4])){
solve();
}
return 0;
}