TopCoder SRM420 Div1 RedIsGood
题意:桌面上有R 张红牌和B 张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1 美元,黑牌则付出1 美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
思路:
期望逆推,设 d p [ i ] [ j ] dp[i][j] dp[i][j]为剩下 i i i张红牌和 j j j张黑牌时候得钱的期望,方程太显然了,要注意的是可以不选,但是期望就是 0 0 0了,直接截下论文的了,注意还得滚动一下数组
#include<bits/stdc++.h>
using namespace std;
class RedIsGood{
public:
double dp[2][5005];
double getProfit(int R,int B){
dp[0][0]=0;
for(int i=0;i<=R;++i){
for(int j=0;j<=B;++j){
if(i==0&&j==0)continue;
if(i==0)dp[i&1][j]=0;
else if(j==0)
dp[i&1][j]=dp[(i-1)&1][j]+1;
else
dp[i&1][j]=max(0.0,(dp[(i-1)&1][j]+1)*1.0*i/(i+j)+(dp[i&1][j-1]-1)*1.0*j/(i+j));
}
}
return dp[R&1][B];
}
};