题意:一个人注冊两个账号,初始rating都是0,他每次拿低分的那个号去打比赛,赢了加50分,输了扣100分。胜率为p,他会打到直到一个号有1000分为止,问比赛场次的期望。
题解:因为每次添加分数或者是降低分数都是50的倍数,因而我们能够压缩成每次赢了添加一分。输了降低2分。依据题意我们easy看出,每次分数的变化都是最小的分数进行变化的。
因而我们定义状态ans[i][j]表示从初状态到两个号的分数为i,j的期望。
我们能够知道两个号的分数的变化总是[i,i]->[i+1,i]->[i+1,i+1];每次仅仅有一个号的分数在进行变动,这样子就比較easy进行状态的转移。
定义dp[i]表示i分数到达i+1分数的期望,则状态转移方程例如以下:
dp[i] = 1×p+(1-p)*(1+dp[i-2]+dp[i-1]+dp[i]); ans[i+1][i] = ans[i][i]+dp[i], ans[i+1][i+1] = ans[i+1][i]+dp[i];
#include <cstdio>
double ans[21][21], dp[21];
int main() {
double p;
int i, j;
while (~scanf("%lf", &p)) {
dp[0] = 1/p, dp[1] = 1+(1-p)/p*(dp[0]+1);
for (i = 2;i <= 19;i++) dp[i] = 1+(1-p)/p*(dp[i-2]+dp[i-1]+1);
ans[0][0] = 0,ans[1][0] = dp[0],ans[1][1] = ans[1][0]+dp[0];
for (i = 1;i <= 19;i++) {
ans[i+1][i] = ans[i][i]+dp[i];
ans[i+1][i+1] = ans[i+1][i]+dp[i];
}
printf("%.6lf\n", ans[20][19]);
}
}