【bzoj1419】Red is good(概率期望dp)

1419: Red is good

Time Limit: 10 Sec Memory Limit: 64 MB
Submit: 1155 Solved: 532
[Submit][Status][Discuss]

Description

桌面上有 R R 张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付
出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input
5 1
Sample Output
4.166666
HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

Red is good







解:

做了这个题,发现自己概率期望dp还是菜的一逼(其实早就发现菜的一逼了)。一开始忘记期望反推还以为别人的式子是错的(233)。然后怀疑了一会儿人生,发现并没有什么问题…

其实是比较水的一道题,用 fi,j f i , j 表示选了 i i 张红牌,j张黑牌状态到结束状态(这里的期望状态不一定把牌选完)的期望得分。

fi,j=max{0,(fi+1,j+1)nin+mij+(fi,j+11)mjn+mij} f i , j = m a x { 0 , ( f i + 1 , j + 1 ) ∗ n − i n + m − i − j + ( f i , j + 1 − 1 ) ∗ m − j n + m − i − j }

也就是说,如果到结束期望得分为负,就停止选。

如何不四舍五入保留六位?减去0.0000005然后四舍五入(呵呵)。

#include<iostream>  
#include<cstdio>  
#include<cstring>  
using namespace std;  

double f[5005];  

int n,m;  

int main()  
{  
    scanf("%d%d",&n,&m);  
    for(int i=n;i>=0;i--)  
      for(int j=m;j>=0;j--)  
        if(i!=n||j!=m)  
          f[j]=max(0.0,(f[j+1]-1.0)*((double)(m-j)/(n+m-i-j))+(f[j]+1.0)*((double)(n-i)/(n+m-j-i)));  
    printf("%.6f",f[0]-0.0000005);  
}  

感觉自己宛如一个智障。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值