GFOJ problem 470: [HbFS-]Red is good 解题报告

题目:http://www.gdfzoj.com/oj/problem/470

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。.其中 R,B<5000

这是一道 玄学的 动态规划题
用 double f[i][j] 表示 翻开 i 张红牌和 j 张黑牌后的期望值
(当期望值小于0是选择不翻于是 “f[i][j] = max(f[i][j],0);”)
而从 f[i-1][j] 和 f[i][j-1] 转移到 f[i][j] 的可能性分别是 “i / (i+j)”和 “j / (i+j)”
答案就是 f[r][b];
关于这类数学期望题,引用一位神犇的总结:

和的期望就是期望的和

然而我不懂

帖代码:(不转double只有95分)

#include <cstdio>
#define max(a,b) (a>b ? a : b)

int r,b,i,j;
double f[5010][5010];

int main() {
    scanf("%d%d",&r,&b);
    for (i=0;i<=r;i++) for (j=0;j<=b;j++) {
        if (i) f[i][j] += (f[i-1][j] + (double)1) / (double)(i+j) * (double)i;
        if (j) f[i][j] += (f[i][j-1] - (double)1) / (double)(i+j) * (double)j;
        f[i][j] = max(f[i][j],0);
    }
    printf("%.6lf\n",f[r][b] - 0.0000005);
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值