TopCoder SRM420 Div1 RedIsGood(期望DP)

TopCoder SRM420 Div1 RedIsGood

题意:桌面上有R 张红牌和B 张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1 美元,黑牌则付出1 美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

思路:

期望逆推,设 d p [ i ] [ j ] dp[i][j] dp[i][j]为剩下 i i i张红牌和 j j j张黑牌时候得钱的期望,方程太显然了,要注意的是可以不选,但是期望就是 0 0 0了,直接截下论文的了,注意还得滚动一下数组

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Wef5UcmE-1605715904744)(C:\Users\98753\AppData\Roaming\Typora\typora-user-images\image-20201119000939899.png)]

#include<bits/stdc++.h>
using namespace std;
class RedIsGood{ 
public:
    double dp[2][5005];
    double getProfit(int R,int B){ 
        dp[0][0]=0;
        for(int i=0;i<=R;++i){ 
            for(int j=0;j<=B;++j){ 
                if(i==0&&j==0)continue;
                if(i==0)dp[i&1][j]=0;
                else if(j==0)
                    dp[i&1][j]=dp[(i-1)&1][j]+1;
                else
                    dp[i&1][j]=max(0.0,(dp[(i-1)&1][j]+1)*1.0*i/(i+j)+(dp[i&1][j-1]-1)*1.0*j/(i+j));
            }
        }
        return dp[R&1][B];
    }
};

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>