题目描述
Alice 和 Bob 两个人正在玩一个游戏,游戏有很多种任务,难度为 p 的任务(p是正整数),有 1/(2^p) 的概率完成并得到 2^(p-1) 分,如果完成不了,得 0 分。一开始每人都是 0 分,从 Alice 开始轮流做任务,她可以选择任意一个任务来做;而 Bob 只会做难度为 1 的任务。只要其中有一个人达到 n 分,即算作那个人胜利。求 Alice 采取最优策略的情况下获胜的概率。
输入格式
一个正整数 n ,含义如题目所述。
输出格式
一个数,表示 Alice 获胜的概率,保留 6 位小数。
输入
1
输出
0.666667
备注
【数据范围】
对于 30% 的数据,n≤10
对于 100% 的数据,n≤500
分析
概率dp入门题
定义
f
[
i
]
[
j
]
f[i][j]
f[i][j] 表示Alice有 i 分,Bob有 j 分时,Alice获胜的最大概率
显然
f
[
n
]
[
i
]
=
1
f[n][i]=1
f[n][i]=1 (i
⊆
0
,
1
,
2
,
.
.
.
,
n
\subseteq {0,1,2,...,n}
⊆0,1,2,...,n)
最后我们要求的就是
f
[
0
]
[
0
]
f[0][0]
f[0][0]
怎么转移呢?
令
2
p
−
1
=
k
2^{p-1}=k
2p−1=k,我们枚举Alice下一步的得分(因为Bob只有0和1两种分值)
由题可知,得到这部分分的概率是
1
2
p
=
1
2
∗
k
\frac{1}{2^p}=\frac{1}{2*k}
2p1=2∗k1
转移方程就呼之欲出了:
f
[
i
]
[
j
]
=
f
[
i
+
k
]
[
j
]
/
4
k
+
f
[
i
+
k
]
[
j
+
1
]
/
4
k
+
f
[
i
]
[
j
+
1
]
∗
(
2
k
−
1
)
/
4
k
+
f
[
i
]
[
j
]
∗
(
2
k
−
1
)
/
4
k
f[i][j]=f[i+k][j]/4k+f[i+k][j+1]/4k+f[i][j+1]*(2k-1)/4k+f[i][j]*(2k-1)/4k
f[i][j]=f[i+k][j]/4k+f[i+k][j+1]/4k+f[i][j+1]∗(2k−1)/4k+f[i][j]∗(2k−1)/4k
除以4k的原因就是有1/2是Bob的,还有1/2*k是Alice的
然后再合并同类项,把右边的
f
[
i
]
[
j
]
f[i][j]
f[i][j]移到左边,就可以得到
f [ i ] [ j ] = ( f [ i + k ] [ j ] + f [ i + k ] [ j + 1 ] + f [ i ] [ j + 1 ] ∗ ( 2 k − 1 ) ) / ( 2 k + 1 ) f[i][j]=(f[i+k][j]+f[i+k][j+1]+f[i][j+1]*(2k-1))/(2k+1) f[i][j]=(f[i+k][j]+f[i+k][j+1]+f[i][j+1]∗(2k−1))/(2k+1)
代码
#include<bits/stdc++.h>
using namespace std;
int n;
double f[505][505];
int main()
{
scanf("%d",&n);
int i,j,k;
for(i=0;i<=n;++i) f[n][i]=1;
for(i=n-1;i>=0;--i)
for(j=n-1;j>=0;--j){
double tmp=-1;
for(k=1;k/2<=n;k<<=1){
int nxt=min(i+k,n);
tmp=max(tmp,(f[nxt][j]+f[nxt][j+1]+(2*k-1)*f[i][j+1])/(2*k+1));
}
f[i][j]=tmp;
}
printf("%.6lf",f[0][0]);
}