题意
有 n n n 个价值为 a i a_i ai 的宝藏,清醒的海盗和喝醉的海盗轮流拿。清醒的海盗总是会拿价值最大的宝藏,喝醉的海盗则会随机挑一个剩下的,问两个海盗获得宝藏总价值的期望。
思路
首先把宝藏价值从小到大排序,由题意每次清醒的海盗都会拿价值最大的,也就是最右侧的,喝醉的海盗随机拿。
反过来思考,在空箱子中从小到大轮流放球,清醒海盗放的球为黑色,醉海盗为白色,第
i
i
i 个球为黑色表示清醒海盗拿了第
i
i
i 个宝藏。
概率dp,dp[i][j]表示已经放了
i
i
i 个球,其中第
j
j
j 个为黑球的概率。
容易得到状态转移方程
设当前放到第i个球,若为黑球(即轮到清醒的海盗)
1.(j<i) dp[i][j] = dp[i-1][j];
2.(j == i) dp[i][j] = 1;
若为白球(即轮到喝醉的海盗)
dp[i][j]=(j-1)/i * dp[i-1][j-1] + (i-j)/i * dp[i-1][j]
先解释黑球时,显然清醒的海盗只会放在最右侧,所以前 i-1 个球的位置不会改变,且第i个位置一定为黑球
白球时,场上
i
−
1
i-1
i−1 个球一共
i
i
i 个空隙,喝醉的海盗放到每个空隙的概率都是等可能的。
对于第
j
j
j 个位置,他有
j
−
1
i
\frac{j-1}{i}
ij−1 的可能性放到左边,使得原本第
j
−
1
j-1
j−1 个球成为了第
j
j
j 个球,也有
i
−
j
i
\frac{i-j}i
ii−j 的概率放到右侧,这样第
j
j
j 个球还是原来的球。
最后答案就是dp[n][i] * a[i]的总和。
当然实现的时候还要把n分为奇偶两种情况考虑,不过这里就比较简单了。
代码
double dp[2][maxn];
//dp[i][j]表示已经放了i个球,左数第j个为黑色的概率
int n;
int a[maxn];
void solve() {
cin >> n;
double sum = 0;
for(int i = 1; i <= n; i++) {
cin >> a[i];
sum += a[i];
}
sort(a + 1, a + n + 1);
bool flag = 0;
if(n & 1) flag = 1;
int p = 0;
for(int i = 1; i <= n; i++) {
p ^= 1;
if(flag) {
for(int j = 1; j < i; j++)
dp[p][j] = dp[p^1][j];
dp[p][i] = 1;
}
else {
for(int j = 1; j <= i; j++) {
double lp = (j-1.0)/i;
double rp = (i-j)*1.0/i;
dp[p][j] = lp*dp[p^1][j-1] + rp*dp[p^1][j];
}
}
flag ^= 1;
}
double ans = 0;
for(int i = 1; i <= n; i++) {
ans += dp[p][i] * a[i];
}
printf("%.9lf %.9lf\n", ans, sum-ans);
}