Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
Input
一行输入两个数R,B,其值在0到5000之间
Output
在最优策略下平均能得到多少钱。
题解:
/*
Prog:bzoj 1419
Solu:
f[i][j]表示i个红的j个黑的期望收益。
f[i][j] = max{(f[i - 1][j] + 1) * (1.0 * i / (i + j)) + (f[i][j - 1] - 1) * (1.0 * j / i + j),0};
然后本来是记忆化搜索的。
然而发现……
搜什么搜……递推!
卡空间……
滚动数组……
*/
#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#define Rep(i,n) for(int i = 1; i <= n ; i ++)
#define RepG(i,x) for(int i = head[x] ;~ i ; i = edge[i].next)
#define Rep_d(i,n) for(int i = n ; i > 0 ; i --)
#define Rep_0(i,n) for(int i = 0 ; i < n ; i ++)
#define RD(i,x,n) for(int i = x; i <= n ; i ++)
#define CLR(a,b) memset(a,b,sizeof(a))
#define RDD(i,x,n) for(int i = x; i >= n; i --)
#define lc ch[0]
#define rc ch[1]
#define v edge[i].to
#define ulfc t[u.lc]
#define urtc t[u.rc]
using namespace std;
const int inf = 1 << 30;
typedef long long ll;
int read(){
char ch = getchar();
while((ch < '0' || ch > '9') && ch != '-')ch = getchar ();
int x = 0;
bool flag = 0;
if(ch == '-')ch = getchar(),flag = 1;
while(ch >= '0' && ch <= '9')x = (x << 1) + (x << 3) + ch - '0',ch = getchar ();
return flag ? -x : x;
}
int n,m;
const int N = 5005;
double f[2][N];
int main (){
n = read(),m = read();
Rep(i,n)
{
f[i & 1][0] = i;
Rep(j,m)
f[i & 1][j] = max( (f[i & 1 ^ 1][j] + 1) * (1.0 * i / (i + j)) + (f[i & 1][j - 1] - 1) * (1.0 * j / (i + j)),0.0);
}
printf("%.6f\n",f[n & 1][m] - (5e-7));
return 0;
}
大概就这样。