假设总共有w颗白色,b颗黑色,数组win用来保存获胜概率,win[i]表示当白色石头还剩i颗时轮到摸石头那个人的获胜概率
这样其他可以暂时不管,只考虑摸到的两种可能:摸到白色的概率是(i / (i + b)),摸到黑色的概率是(b / (i + b))
那么这个玩家获胜方法有两种:
1、假设i > 1,摸到白色的,这时i变为i - 1,但是还没赢,所以要乘上(1 - win[i - 1]),即在下一轮赢
2、摸到黑色的,这样就轮到对面玩家和当前玩家面对一样的情况了,即i颗白和b颗黑,那么当前玩家获胜的概率就要乘上(1 - win[i]),即对方不赢的概率
那么总结一个公式:
win[i] = (i / (i + b)) × (1 - win[i - 1]) + (b / (i + b)) × (1 - win[i])
解这个式子,结果:
win[i] = (i × (1 - win[i - 1]) + b) / (i + 2b)
3、递推的终点:i = 1,这时我们换一种方法,很简单:
win[1] = (1 / (1 + b)) + (b / 1 + b)2 × (1 / (1 + b)) + (b / 1 + b)4 × (1 / (1 + b)) + (b / 1 + b)6 × (1 / (1 + b)) + ...
用等比求和公式、极限法:
win[1] = (1 / (1 + b)) * lim n→inf((1 - (b / 1 + b)2n) / (1 - (b / 1 + b)2))
= (1 + b) / (1 + 2b)
4、然后,在这个地方突然发现,其实递归的终点可以到0,把2中得出来的公式中的i代为1,设win[0]为0
#include <iostream>
using namespace std;
long double win[120];
int main(){
int n, iw, ib;
long double w, b, tmp;
win[0] = 0;
cin >> n;
while (n --){
cin >> iw >> ib;
w = (long double)iw; b = (long double)ib;
for (int i = 1; i <= w; i ++){
tmp = (long double)i;
win[i] = (tmp * (1 - win[i - 1]) + b) / (tmp + 2 * b);
}
cout << fixed << win[iw] << endl;
}
return 0;
}