【期望DP】BZOJ1419[Red is good]题解

题目概述

A 张红牌, B 张黑牌。现在将 A+B 张牌打乱,每次翻牌。翻到红牌得到一元钱,翻到黑牌失去一元钱。可以随时停止翻牌,求在最优策略下得到钱数的期望。

解题报告

期望DP通用套路,倒着来。定义 f[i][j] 表示剩下 i 张红牌, j 张黑牌得到钱数的期望。

那么 f[i][j]=ii+jf[i1][j]+ji+jf[i][j1] ,由于可以随时停止翻牌,所以当 f[i][j]<0 时,莫不如停止翻牌,令 f[i][j]=0

示例程序

#include<cstdio>
#include<algorithm>
using namespace std;
typedef double DB;
const int maxn=5000;

int A,B;DB f[2][maxn+5],ans;

int main()
{
    freopen("program.in","r",stdin);
    freopen("program.out","w",stdout);
    scanf("%d%d",&A,&B);
    for (int i=0,c=0;i<=A;i++,c^=1)
    for (int j=0;j<=B;j++)
    {
        f[c][j]=0;
        if (i) f[c][j]+=(f[c^1][j]+1)*i/(i+j);
        if (j) f[c][j]+=(f[c][j-1]-1)*j/(i+j);
        f[c][j]=max(f[c][j],0.0);
    }
    return f[A&1][B]=(int)(f[A&1][B]*1e6),printf("%.6f\n",f[A&1][B]/1e6),0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值