【BZOJ1419】【期望DP】Red is good 题解

版权声明:Its Maverick https://blog.csdn.net/MaverickFW/article/details/78418761

Description

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
Input

一行输入两个数R,B,其值在0到5000之间
Output

在最优策略下平均能得到多少钱。
Sample Input

5 1
Sample Output

4.166666
HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

#include <bits/stdc++.h>
#define INF 2147483647
#define LL long long
#define clr(x) memset(x, 0, sizeof x)
#define ms(a, x) memset(x, a, sizeof x)
#define digit (ch <  '0' || ch >  '9')
#ifdef WIN32
#define AUTO "%I64d"
#else
#define AUTO "%lld"
#endif

using namespace std;

template <class T> inline void read(T &x) {
    int flag = 1; x = 0;
    char ch = getchar();
    while( digit) { if(ch == '-')  flag = -1; ch = getchar(); }
    while(!digit) { x = (x<<1)+(x<<3)+ch-'0'; ch = getchar(); }
    x *= flag;
}

const int maxn = 5005;
int r,b;
double dp[2][maxn];

int main() {
    read(r); read(b);
    for(int i = 1; i <= r; i++) {
        dp[i&1][0] = i;
        for(int j = 1; j <= b; j++) dp[i&1][j] = max(0.0 , i/(double)(i+j)*(dp[!(i&1)][j]+1)+j/(double)(i+j)*(dp[i&1][j-1]-1));
    }
    printf("%.6lf\n",dp[r&1][b]-5e-7);
    return 0;
}
展开阅读全文

没有更多推荐了,返回首页