题意:一个人注册两个账号,初始rating都是0,他每次拿低分的那个号去打比赛,赢了加50分,输了扣100分,胜率为p,他会打到直到一个号有1000分为止,问比赛场次的期望。
题解:由于每次增加分数或者是减少分数都是50的倍数,因而我们可以压缩成每次赢了增加一分,输了减少2分。根据题意我们容易看出,每次分数的变化都是最小的分数进行变化的。
因而我们定义状态ans[i][j]表示从初状态到两个号的分数为i,j的期望。我们可以知道两个号的分数的变化总是[i,i]->[i+1,i]->[i+1,i+1];每次只有一个号的分数在进行变动,这样子就比较容易进行状态的转移。定义dp[i]表示i分数到达i+1分数的期望,则状态转移方程如下:
dp[i] = 1×p+(1-p)*(1+dp[i-2]+dp[i-1]+dp[i]); ans[i+1][i] = ans[i][i]+dp[i], ans[i+1][i+1] = ans[i+1][i]+dp[i];
#include <cstdio>
double ans[21][21], dp[21];
int main() {
double p;
int i, j;
while (~scanf("%lf", &p)) {
dp[0] = 1/p, dp[1] = 1+(1-p)/p*(dp[0]+1);
for (i = 2;i <= 19;i++) dp[i] = 1+(1-p)/p*(dp[i-2]+dp[i-1]+1);
ans[0][0] = 0,ans[1][0] = dp[0],ans[1][1] = ans[1][0]+dp[0];
for (i = 1;i <= 19;i++) {
ans[i+1][i] = ans[i][i]+dp[i];
ans[i+1][i+1] = ans[i+1][i]+dp[i];
}
printf("%.6lf\n", ans[20][19]);
}
}