1419: Red is good
Time Limit: 10 Sec Memory Limit: 64 MB
Submit: 1155 Solved: 532
[Submit][Status][Discuss]
Description
桌面上有
R
R
张红牌和张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付
出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
Input
一行输入两个数R,B,其值在0到5000之间
Output
在最优策略下平均能得到多少钱。
Sample Input
5 1
Sample Output
4.166666
HINT
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
解:
做了这个题,发现自己概率期望dp还是菜的一逼(其实早就发现菜的一逼了)。一开始忘记期望反推还以为别人的式子是错的(233)。然后怀疑了一会儿人生,发现并没有什么问题…
其实是比较水的一道题,用 fi,j f i , j 表示选了 i i 张红牌,张黑牌状态到结束状态(这里的期望状态不一定把牌选完)的期望得分。
fi,j=max{0,(fi+1,j+1)∗n−in+m−i−j+(fi,j+1−1)∗m−jn+m−i−j} f i , j = m a x { 0 , ( f i + 1 , j + 1 ) ∗ n − i n + m − i − j + ( f i , j + 1 − 1 ) ∗ m − j n + m − i − j }
也就是说,如果到结束期望得分为负,就停止选。
如何不四舍五入保留六位?减去0.0000005然后四舍五入(呵呵)。
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
double f[5005];
int n,m;
int main()
{
scanf("%d%d",&n,&m);
for(int i=n;i>=0;i--)
for(int j=m;j>=0;j--)
if(i!=n||j!=m)
f[j]=max(0.0,(f[j+1]-1.0)*((double)(m-j)/(n+m-i-j))+(f[j]+1.0)*((double)(n-i)/(n+m-j-i)));
printf("%.6f",f[0]-0.0000005);
}
感觉自己宛如一个智障。