bzoj 1419(期望dp)

传送门

题解:

设f[i][j]表示已经使用了i张红牌,j张黑牌的最大期望收益。

转移方程:f[i][j]=max(0.0,1.0*i/(i+j)*(f[i-1][j]+1)+1.0*j/(i+j)*(f[i][j-1]-1))

边界:f[i][0]=i

直接做要MLE,所以第一维采用滚动数组优化。

#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
typedef long long ll;
double f[2][5002];
int n,m;
int main() {
	scanf("%d%d",&n,&m);
	int cur=0;
	for (int i=1;i<=n;++i) {
		cur^=1,f[cur][0]=i;
		for (int j=1;j<=m;++j)
			f[cur][j]=max(0.0,1.0*i/(i+j)*(f[cur^1][j]+1)+1.0*j/(i+j)*(f[cur][j-1]-1));
	}
	printf("%.6lf\n",1.0*(ll)(f[cur][m]*1000000)/1000000);
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值