Description
Alice和Bob在玩一个游戏。有n个石子在这里,Alice和Bob轮流投掷硬币,如果正面朝上,则从n个石子中取出一个石子,否则不做任何事。取到最后一颗石子的人胜利。Alice在投掷硬币时有p的概率投掷出他想投的一面,同样,Bob有q的概率投掷出他相投的一面。
现在Alice先手投掷硬币,假设他们都想赢得游戏,问你Alice胜利的概率为多少。
Input
第一行一个正整数t,表示数据组数。
对于每组数据,一行三个数n,p,q。
Output
对于每组数据输出一行一个实数,表示Alice胜利的概率,保留6位小数。
Solution
设f[i]为Alice先手,还剩i个石子Alice获胜的概率
g[i]为Bob先手,还剩i个石子Alice获胜的概率,则易得
f
[
i
]
=
p
×
g
[
i
−
1
]
+
(
1
−
p
)
q
×
f
[
i
−
1
]
1
−
(
1
−
p
)
(
1
−
q
)
g
[
i
]
=
q
×
f
[
i
−
1
]
+
(
1
−
q
)
p
×
g
[
i
−
1
]
1
−
(
1
−
p
)
(
1
−
q
)
f[i]=\dfrac{p\times g[i−1]+(1−p)q\times f[i−1]}{1−(1−p)(1−q)}\\ g[i]=\dfrac{q\times f[i−1]+(1−q)p\times g[i−1]}{1−(1−p)(1−q)}
f[i]=1−(1−p)(1−q)p×g[i−1]+(1−p)q×f[i−1]g[i]=1−(1−p)(1−q)q×f[i−1]+(1−q)p×g[i−1]
然后会发现这个东西收敛,差不多100以后答案不会动。
然后代入即可得到WA.
因为Alice想赢,不一定非要想取石子呀。
所以当f[i−1]>g[i−1]时,我们应该按他们不想取石子处理,即P=1-P,Q=1-Q(因为当Alice不想取石子时,Bob也不会想取石子)
Code
#include <cstdio>
#define maxn 105
int t,n;
double P,Q,pub,f[maxn],g[maxn];
int main()
{ scanf("%d",&t);
while(t--)
{ scanf("%d%lf%lf",&n,&P,&Q);
g[0]=1;if(n>100) n=100;
for(int i=1;i<=n;++i)
{ if(f[i-1]>g[i-1]) P=1-P,Q=1-Q;
pub=1-(1-P)*(1-Q);
f[i]=(f[i-1]*Q*(1-P)+g[i-1]*P)/pub;//f is Alice first
g[i]=(g[i-1]*P*(1-Q)+f[i-1]*Q)/pub;//g is Bob first
if(f[i-1]>g[i-1]) P=1-P,Q=1-Q;
}
printf("%.6lf\n",f[n]);
}
return 0;
}