分赌注问题_分堵住问题-CSDN博客

本文链接：https://blog.csdn.net/qq_37392059/article/details/111350919

问题概述

水平相同的两个赌徒A和B，约定先胜 $t$ 局的人赢得赌注，在赌博中的某时刻，两赌徒中止赌博，此时A胜 $r$ 局，B胜 $s$ 局，应如何合理分配赌注?

问题分析

公平起见，最常见的分堵赌注方式即为计算如果继续进行赌博，两个人分别获胜的概率，依据获胜概率来分赌注，即若记两人分别取得最后胜利的概率为 $p_A,p_B$ 满足 $p_A+p_B=1$ ，则两人应按照 $p_A:p_B$ 的比例分赌注。因此，接下来的目标为分别计算两人的获胜概率。为了描述问题方便起见，假设 $r\geqslant s$ ，并记每场赌博A获胜的概率为 $p = 0.5$ 。

问题解答

显然，赌博最少会在 $t - r$ 次后结束，即A赢了这之后的所有赌博，最终取得胜利。而最多，赌博会在 $2 t - r - s - 1$ 次后结束，即将整场赌博打满，最终A、B分别赢得 $t$ 或 $t - 1$ 场。

思路一

记 $t-r\leqslant i\leqslant2t-r-s-1$ ，可以考虑分别计算赌博在 $i$ 场后结束，A、B分别获胜的概率 $p_A(i)$ 和 $p_B(i)$ ，最后分别对其求和即可得到A、B分别最终获胜的概率。

先考虑A。显然，当 $i = t - r$ 时， $p_A(t-r)=p^{t-r},$ 表示A连续获胜 $i$ 轮。

当 $i = t - r + 1$ 时，若要赌博在i场时恰好结束，并且A获胜，则A要继续赢 $t - r$ 次，B赢1次。注意到B赢得一次不可能在最后一次出现，否则在前一次A已经取胜，即确定A在最后一次获胜。因此有
$p_A(t-r)=p^{t-r} (1-p) \binom{t-r}{t-r-1}.$

当 $i$ 取更一般的值时，若要赌博在i场时恰好结束，并且A获胜，则A要继续赢 $t - r$ 次，B赢 $i - (t - r)$ 次。同时有B赢的不可能在最后一次出现，否则在前一次A已经取胜，即确定A在最后一次获胜。因此有
$p_A(i)=p^{t-r} (1-p)^{i-t+r} \binom{i-1}{t-r-1}.$

记 $n = t - r$ 表示A要获胜还需要赢的次数，并注意到 $p = 0.5$ ，上式化简为
$p_A(i)=p^{i}\binom{i-1}{n-1},\text{ }n\leqslant i\leqslant2t-r-s-1.$

对于B，注意到，在 $i\geqslant t-s$ 之后B才可能获胜。记 $m = t - s$ ，表示B要获胜还需要赢的次数，与A类似有
$p_B(i)=p^{i}\binom{i-1}{m-1},\text{ }m\leqslant i\leqslant2t-r-s-1.$

由此，我们得出A、B分别获胜的概率分别为 $p_A = \sum_{i=n}^{2t-r-s-1}p_A(i) = \sum_{i=n}^{n+m-1}p^{i}\binom{i-1}{n-1},$

$p_B = \sum_{i=m}^{2t-r-s-1}p_B(i) = \sum_{i=m}^{n+m-1}p^{i}\binom{i-1}{m-1}.$

思路二

A的获胜条件也可以直接抽象为：若A在每一把赌博中获胜的概率均为 $p (= 0.5)$ ，A需要在B赢 $m$ 次之前赢 $n$ 次，其中 $n, m$ 定义均与之前相同，分别表示A、B要取胜所需的最少次数。而这个条件，等价于如下条件：如果赌博不会终止，则A需要在接下来的 $n + m - 1$ 次中赢得至少 $n$ 次。这个结果的概率可以直接使用二项分布求解，即赢 $i(n\leqslant i\leqslant n+m-1)$ 次的概率为 $p^{i} (1-p)^{n+m-1-i} \binom{n+m-1}{i}$ ，因此A最终获胜的概率为其求和，即
$p_A = \sum_{i=n}^{n+m-1}p^{i} (1-p)^{n+m-1-i} \binom{n+m-1}{i},$
其实质为次数为 $n + m - 1$ 的二项式的后 $m$ 项之和。类似得B获胜概率为
$p_B = \sum_{i=m}^{n+m-1}(1-p)^{i} p^{n+m-1-i} \binom{n+m-1}{i}。$

在 $p_B$ 中做代换 $j = n + m - 1 - i$ ，可以验证 $\begin{aligned} p_A + p_B &= \sum_{i=n}^{n+m-1}p^{i} (1-p)^{n+m-1-i} \binom{n+m-1}{i} + \sum_{i=m}^{n+m-1}(1-p)^{i} p^{n+m-1-i} \binom{n+m-1}{i}\\ &=\sum_{i=n}^{n+m-1}p^{i} (1-p)^{n+m-1-i} \binom{n+m-1}{i} + \sum_{j=0}^{n-1}p^{j} (1-p)^{n+m-1-j} \binom{n+m-1}{j}\\ &=\sum_{i=0}^{n+m-1}p^{i} (1-p)^{n+m-1-i} \binom{n+m-1}{i}\\ &=[p+(1-p)]^{n+m-1}=1. \end{aligned}$

两种思路的比较

下面证明两种思路得到的两种 $p_A$ 的表达式是等价的，即证明
$\sum_{i=n}^{n+m-1}p^{n} (1-p)^{i-n} \binom{i-1}{n-1} = \sum_{i=n}^{n+m-1}p^{i} (1-p)^{n+m-1-i} \binom{n+m-1}{i}.$

注意到上式两端都有 $p^n$ 项，消去即证 $\sum_{i=n}^{n+m-1} (1-p)^{i-n} \binom{i-1}{n-1} = \sum_{i=n}^{n+m-1}p^{i-n} (1-p)^{n+m-1-i} \binom{n+m-1}{i}.$

注意到上式左侧为 $1 - p$ 的多项式，因此考虑记 $q = 1 - p$ ，将右端的 $p$ 项展开，证明对应项系数相等。
$\begin{aligned} \text{右端} &=\sum_{i=n}^{n+m-1}q^{n+m-1-i}(1-q)^{i-n} \binom{n+m-1}{i}\\ &=q^{m-1}\binom{n+m-1}{n}+q^{m-2}(1-q)\binom{n+m-1}{n+1}+\cdots+(1-q)^{m-1}\binom{n+m-1}{n+m-1}. \end{aligned}$

将上式中的 $(1 - q)$ 的次幂展开，得到 $\begin{aligned} \text{右端}=q^{m-1}\binom{n+m-1}{n} &+\\ \left[q^{m-2}-q^{m-1}\right] \binom{n+m-1}{n+1} &+\\ \ldots&\\ \left[q^2\binom{m-3}{0}-q^3\binom{m-3}{1}+\cdots +(-q)^{m-3}\binom{m-1}{m-3}\right] \binom{n+m-1}{n+m-3} &+\\ \left[q-q^2\binom{m-2}{1}+q^3\binom{m-2}{2}-\cdots +(-q)^{m-2}\binom{m-1}{m-2}\right] \binom{n+m-1}{n+m-2} &+\\ \left[1-q\binom{m-1}{1}+q^2\binom{m-1}{2}+q^3\binom{m-1}{3}-\cdots +(-q)^{m-1}\binom{m-1}{m-1}\right] \binom{n+m-1}{n+m-1} &.\\ \end{aligned}$

上式中易得 $q^{k}(0\leqslant k\leqslant m-1)$ 的系数 $a_k$ 为
$\begin{aligned} a_k=&\sum_{i=0}^{k}(-1)^{i}\binom{m-k-1+i}{i}\binom{n+m-1}{n+m-1-k+i}\\ =&\sum_{i=0}^{k}(-1)^{i}\binom{m-k-1+i}{i}\binom{n+m-1}{k-i}. \end{aligned}$

由上指标反转公式，得 $(-1)^{i}\binom{m-k-1+i}{i}=\binom{k-m}{i}.$

由范德蒙德卷积，进而有，
$a_k=\sum_{i=0}^{k}\binom{k-m}{i}\binom{n+m-1}{k-i}=\binom{n+k-1}{k}.$

在上式中， $\text{左侧}=\sum_{k=0}^{m-1}q^k\binom{n+k-1}{n-1}.$

显然有对应项系数相等。因此，两种思路中得到得A获胜概率表达式是等价的。同理可得，B的表达式也是等价的。

仿真实验

下面带入具体数据，进行仿真，以检验上述求解的正确性。假设赌徒A和B的胜率相同，即每一局的A和B都有 $p = 0.5$ 的机会赢得胜利，假设先胜 $s = 20$ 局的人赢得赌注，并假设在A胜 $r = 10$ 局且B胜 $s = 7$ 局的时候中止赌博。

使用Matlab随机数产生器模拟赌博结果，产生的随机数大于0.5则认为单局赌博A获胜，否则B获胜。模拟得到下表。

仿真次数	100	1000	10000	100000	1000000
A获胜频率	0.79	0.723	0.7340	0.73602	0.738237

而计算出的理论结果为 $p_A = 0.738266468048096$

可见，随着模拟次数的增加，A获胜的比率逐渐接近理论计算概率。这也侧面说明理论计算的正确性。

代码

仿真

clear
t = 20;
r = 10;
s = 7;
ma = t*2-r-s-1;
p = 1/2;

tot = 1000000;
vina = 0;
vinb = 0;
for i = 1:tot
	sa = r;
	sb = s;
	while sa<t && sb<t
		if(rand()>0.5)
			sa = sa + 1;
		else
			sb = sb + 1;
		end
	end
	if sa==t
		vina = vina + 1;
	else
		vinb = vinb + 1;
	end
end
[vina/tot]

计算

t = 20;
r = 10;
s = 7;
ma = t*2-r-s-1;
p = 0.5;
a_left = t - r;
b_left = t - s;

[P(a_left,b_left, p),P(b_left,a_left, 1-p)]

function sum = P(n,m,p)
	sum = 0;
	for k= n:n+m-1
		sum = sum + nchoosek(n+m-1,k)*p^(k)*(1-p)^(n+m-1-k);
	end
end