Gym102916D. Two Pirates - 2 期望dp

Link

题意

n n n 个价值为 a i a_i ai 的宝藏,清醒的海盗和喝醉的海盗轮流拿。清醒的海盗总是会拿价值最大的宝藏,喝醉的海盗则会随机挑一个剩下的,问两个海盗获得宝藏总价值的期望。

思路

首先把宝藏价值从小到大排序,由题意每次清醒的海盗都会拿价值最大的,也就是最右侧的,喝醉的海盗随机拿。
反过来思考,在空箱子中从小到大轮流放球,清醒海盗放的球为黑色,醉海盗为白色,第 i i i 个球为黑色表示清醒海盗拿了第 i i i 个宝藏。
概率dp,dp[i][j]表示已经放了 i i i 个球,其中第 j j j 个为黑球的概率。
容易得到状态转移方程

设当前放到第i个球,若为黑球(即轮到清醒的海盗)
1.(j<i) dp[i][j] = dp[i-1][j]; 
2.(j == i) dp[i][j] = 1;			
若为白球(即轮到喝醉的海盗)
dp[i][j]=(j-1)/i * dp[i-1][j-1] + (i-j)/i * dp[i-1][j]

先解释黑球时,显然清醒的海盗只会放在最右侧,所以前 i-1 个球的位置不会改变,且第i个位置一定为黑球
白球时,场上 i − 1 i-1 i1 个球一共 i i i 个空隙,喝醉的海盗放到每个空隙的概率都是等可能的。
对于第 j j j 个位置,他有 j − 1 i \frac{j-1}{i} ij1 的可能性放到左边,使得原本第 j − 1 j-1 j1 个球成为了第 j j j 个球,也有 i − j i \frac{i-j}i iij 的概率放到右侧,这样第 j j j 个球还是原来的球。
最后答案就是dp[n][i] * a[i]的总和。
当然实现的时候还要把n分为奇偶两种情况考虑,不过这里就比较简单了。

代码

double dp[2][maxn];
//dp[i][j]表示已经放了i个球,左数第j个为黑色的概率
int n;
int a[maxn];
void solve() {
    cin >> n;
    double sum = 0;
    for(int i = 1; i <= n; i++) {
    	cin >> a[i];
    	sum += a[i];
    }
    sort(a + 1, a + n + 1);
    bool flag = 0;
    if(n & 1) flag = 1;
    int p = 0;
	for(int i = 1; i <= n; i++) {
	    p ^= 1;
    	if(flag) {
			for(int j = 1; j < i; j++)
    			dp[p][j] = dp[p^1][j];
    		dp[p][i] = 1;
    	}
    	else {
    		for(int j = 1; j <= i; j++) {
    			double lp = (j-1.0)/i;
    			double rp = (i-j)*1.0/i;
    			dp[p][j] = lp*dp[p^1][j-1] + rp*dp[p^1][j];
    		}
    	}
    	flag ^= 1;
    }
    double ans = 0;
    for(int i = 1; i <= n; i++) {
    	ans += dp[p][i] * a[i];
    }
    printf("%.9lf %.9lf\n", ans, sum-ans);
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值