TopCoder 9915(期望递推)
题意
桌面上有 R R 张红牌和 张黑牌, 随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到 1 1 美元,黑牌则付出 美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。分析
用 f[i,j] f [ i , j ] 表示剩下 i i 张红牌和 张黑牌获得钱的期望。决定翻牌或不翻。不翻牌则期望为 0 0 ,翻牌时,期望为。因此,有下列状态转移方程:
f[i,j]=⎧⎩⎨⎪⎪0,f[i−1,j]+1,max(0,ii+j∗(f[i−1,j]+1)+ji+j(f[i,j−1]−1),i=0i>0,j=0i>0,j>0 f [ i , j ] = { 0 , i = 0 f [ i − 1 , j ] + 1 , i > 0 , j = 0 m a x ( 0 , i i + j ∗ ( f [ i − 1 , j ] + 1 ) + j i + j ( f [ i , j − 1 ] − 1 ) , i > 0 , j > 0
由于
R
R
和最多达到
5000
5000
,空间不够直接开二维数组,用滚动数组压缩空间,因为B从小到大迭代一次就没用了。
- 代码
#include <bits/stdc++.h>
using namespace std;
const int maxn=5010;
class RedIsGood
{
public :
double F[maxn];
double getProfit(int R,int B)
{
for(int i=0;i<=R;++i) F[i]=i;
for(int j=1;j<=B;++j)
for(int i=0;i<=R;++i)
F[i]=max(0.0,(1.0*i/(i+j))*(F[i-1]+1)+(1.0*j/(i+j))*(F[i]-1));
return F[R];
}
};