bzoj1419 Red is good（概率dp）

最新推荐文章于 2018-04-26 11:24:59 发布

zmy_wky

最新推荐文章于 2018-04-26 11:24:59 发布

阅读量268

点赞数

分类专栏：动态规划文章标签：动态规划概率dp

本文链接：https://blog.csdn.net/zmy_wky/article/details/79585609

版权

动态规划专栏收录该内容

13 篇文章 0 订阅

订阅专栏

Description

桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

做了这道题发现我的概率dp真的是太弱了，这么简单的dp式子都推错了。
我们可以用 $dp[i][j]$ 表示已经选了 $i$ 张红牌， $j$ 张黑牌，离全部选完可以得到的收益，那么
$dp[i][j]=max(0,dp[i+1][j]*\frac{n-i}{n+m-i-j}+dp[i][j+1]*\frac{m-j}{n+m-i-j})$
然后倒推得到dp[0][0]即答案。
另外需要注意本题空间限制为64MB，所以要把二维数组换成滚动数组。

代码：

#include<bits/stdc++.h>
using namespace std;

int n,m;
double dp[5010];

int main()
{
    scanf("%d%d",&n,&m);
    for(int i=n;i>=0;i--)
      for(int j=m;j>=0;j--)
        if(i!=n||j!=m)
          dp[j]=max(0.0,(dp[j]+1)*(double)(n-i)/(n+m-i-j)+(dp[j+1]-1)*(double)(m-j)/(n+m-i-j));
    printf("%.6lf",dp[0]-5e-7);
    return 0;
}

zmy_wky

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
bzoj1419 Red is good（概率dp）

Description桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。Input一行输入两个数R,B,其值在0到5000之间Output在最优策略下平均能得到多少钱。Sample Input5 1Sample Output4.166666...
复制链接

扫一扫

专栏目录