引言
第一次写博客。。。
原题链接:http://www.gdfzoj.com/oj/problem/470
标签:dp,数学期望
题意描述
Problem 470: [HbFS-]Red is good
Time Limit: 1000 ms
Memory Limit: 524288 KB
Problem Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。 输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
Input
一行输入两个数R,B,其值在0到5000之间
Output
在最优策略下平均能得到多少钱。
Sample Input
5 1
Sample Output
4.166666
分析
从题意直接看似乎没有什么思路,但是如果能够想到适当的策略,解法就比较明显了。
先从解法策略考虑,我们可以用“见好就收”的策略,就是
取下一张牌当且仅当剩下的红牌的数量大于等于剩下的黑牌的数量
搬运数学期望公式:
E(x)=∑i=1nXiPi
有了这个公式,我们可以设E(x,y)来表示当取剩下x张红牌,y张黑牌是的期望值
那么,递推公式就是
E(x,y)=xx+y(E(x−1,y)+1)+yx+y(E(x,y−1)−1)
其中,前面表示取到红牌的情况,后面表示取到黑牌的情况。
然后进行特判,如果E(x,y)小于0,则表示剩下的红牌的数量小于剩下的黑牌的数量,那么就停止翻盘。
最后输出E(R,B)即为答案。
代码
#include<cstdio>
#define max 5500
using namespace std;
int i,j,r,b;
double e[max][max],ll,rr;
int main()
{
scanf("%d%d",&r,&b);
//for (i=0;i<=r;i++) e[i][0]=i;
for (i=0;i<=r;i++)
for (j=0;j<=b;j++)
{
ll=(double)i/(double)(i+j); rr=(double)j/(double)(i+j);
if (i) e[i][j]+=(e[i-1][j]+1)*ll;
if (j) e[i][j]+=(e[i][j-1]-1)*rr;
if (e[i][j]<0) e[i][j]=0;
}
printf("%.6f",e[r][b]-0.0000005);
return 0;
}