BZOJ 1419: Red is good 期望DP

Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
Input
一行输入两个数R,B,其值在0到5000之间
Output
在最优策略下平均能得到多少钱。
Sample Input
5 1
Sample Output
4.166666
HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

解法:

///f[i][j]表示有i张红j张黑情况下的期望收益

///f[i][j]=max(0,i/(i+j)(f[i-1][j]+1)+j/(i+j)(f[i][j-1]-1))

///转移是和很好理解的,如果选了的期望收益<0,那么不如不选

///BZOJ 1419

#include <bits/stdc++.h>
using namespace std;

const int maxn = 5010;
int n, m;
double dp[2][maxn];
///f[i][j]表示有i张红j张黑情况下的期望收益
///f[i][j]=max(0,i/(i+j)*(f[i-1][j]+1)+j/(i+j)*(f[i][j-1]-1))
///转移是和很好理解的,如果选了的期望收益<0,那么不如不选

int now=0,pre=1;
int main(){
    scanf("%d%d",&n,&m);
    dp[0][0]=0;
    for(int i=1; i<=n; i++){
        swap(now, pre);
        dp[now][0]=i;
        for(int j=1; j<=m; j++){
            dp[now][j] = max(0.0, 1.0*i/(i+j)*(dp[pre][j]+1)+1.0*j/(i+j)*(dp[now][j-1]-1));
        }
    }
    long long ans=floor(dp[now][m]*1000000);
    printf("%lld.%.06lld\n", ans/1000000, ans%1000000);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值