第19章随机变量

最新推荐文章于 2024-04-26 23:38:25 发布

侯一鸣Supermonkey

最新推荐文章于 2024-04-26 23:38:25 发布

阅读量1.3k

点赞数

分类专栏：计算机科学中的数学文章标签：概率论

本文链接：https://blog.csdn.net/qq_19830591/article/details/128435827

版权

计算机科学中的数学专栏收录该内容

20 篇文章

订阅专栏

第19章随机变量

19.1随机变量示例

定义19.1.1：概率空间上的随机变量R是域等于样本空间的全函数。

R的陪域可以是任何东西，但通常是实数的一个子集。

例：

例如，假设我们抛三个独立的、公平的硬币。令C表示正面朝上的次数。如果三个硬币全都是正面或者全都是反面朝上，则令M= 1;否则，M = 0。那么，三个硬币抛掷的每一个结果唯一确定C和M的值。

那么,C是将样本空间中的每个结果映射成数值的函数,即:

同理,M是将样本空间中的每个结果按另一种方式映射的函数，如下:

所以，M和C是随机变量。

19.1.1 指示器随机变量

指示器随机变量是将每个结果映射成0或1的随机变量。指示器随机变量又称伯努利变量。上文提到的随机变量M就是指示器随机变量。如果抛出的三个硬币的面相同，则M=1，否则M=0。

同样地，事件E将样本空间划分为：属于E的结果，以及不属于E的结果。所以，事件E天然带有一个相应的指示器随机变量 $I_E$ :若结果w ∈ E，则 $I_E$ (w)=1;若 $w\notin E$ ，则 $I_E$ (w)= 0。因此,M= $I_E$ ，其中E表示事件“三个硬币抛的面相同”。

19.1.2 随机变量和事件

事件和一般的随机变量之间也存在着密切的联系。一个随机变量有几个值，就能将样本空间分为几个块。例如，C将样本空间划分为:

每一个块对应样本空间的一个子集,因此是一个事件。

一般来说,任意关于随机变量取值的断言( assertion)都定义了一个事件。

19.2独立性

独立性 ( independence)既可以用于描述事件又可以用于描述变量。随机变量 $R_1$ 和 $R_2$ 是独立的,当且仅当以下两个事件

对于所有的x1,x2是独立的。

引理19.2.1 两个事件独立，当且仅当这两个事件的指示器变量是独立的。

从直觉上来说，两个随机变量独立，意味着知道一个变量的某些信息，对另一个变量没有任何帮助。一个变量R的“某些信息”是指与R有关的某个数值。而且，这种独立的特性意味着独立变量的函数也是相互独立的。

引理19.2.2：设R和S是两个独立的随机变量，f和g是两个函数，其中域(f)=陪域®且域(g)=陪域(S)。那么，f®和g(S)是独立随机变量。

定义19.2.3：随机变量 $R_1,R_2…,R_n$ 是相互独立的当且仅当对于所有的 $X_1,X_2,… ,X_n$ ，n个事件

是相互独立的。它们是k-次独立的当且仅当它们的任意k元素子集是相互独立的。

19.3 分布函数

随机变量将结果映射为数值。随机变量R的概率密度函数 $PDF_R(x)$ 衡量了R取值为x的概率，以及密切相关的累积分布函数 $CDF_R(x)$ 衡量了R ≤ X的概率。不同结果空间的随机变量常常具有相似的表现形式，是因为它们不同取值的概率相同，也就是说，它们具有相同的PDF/CDF。

定义19.3.1：设R是一个随机变量，陪域为V。R的概率密度函数为PDFR:V→[0,1]，定义如下:

如果陪域是实数的子集，那么累积分布函数为 $CDF_R:R→[0,1]$ ，定义如下:

由此可以推导出：

PDF;和CDF,都能提供关于R的信息，任君挑选。关键的一点是，无论是概率密度函数还是累积分布函数，都不涉及实验的样本空间。

事实上，有些PDF非常常见，所以都有特别的名字。例如，在计算机科学领域，有三个最重要的分布:伯努利分布、均匀分布和二项分布。接下来，我们仔细探讨一下这些分布。

19.3.1 伯努利分布

伯努利分布是伯努利变量的分布函数。具体来说，伯努利分布的概率密度函数的形式为fp:{0,1} →[0,1]，其中

其中 $\in [0,1]$ 。相应的累积分布函数为Fp:R→[0,1]，其中:

19.3.2均匀分布

如果随机变量以相等的概率、取值为陪域中任意一个可能的值，则这个随机变量是均匀的。若陪域V有n个元素，那么均匀分布的概率密度函数的形式为:

其中：

对所有v∈V成立。

如果V的元素按递增顺序依次为 $a_1, a_2,… , a_n$ ，那么累积分布函数为F:R→ [0,1]，其中:

19.3.3数字游戏

让我们来玩个游戏吧!有两个信封,每个信封里写有一个范围在0,1,…,100之间的整数,而且两个信封中的数字不同。如果猜出哪一个信封中的数字更大,那么你就赢了。为了给你一点机会，我们允许你任意选择一个信封，看一下信封中的数字。这样的话，有没有一种策略,使你赢得游戏的概率大于50%呢?

制胜策略分析

一般地,假设从整数区间[0…n]中挑选两个数。我们把较小的数称为L,把较大的数称为H。

你的目标是猜一个在L和H中间的数值x。选完x以后，你看到一个信封里的数字，设这个数字为T。如果T > x，那么你猜你看到的这个数字是比较大的。如果T<x，那么你猜另一个信封中的数字比较
接下来就是确定这个策略获胜的概率。我们采用四步法和树状图。

第一步:找到样本空间

你选择的x可能过小(<L)、过大(>H)，或者刚刚好(L<x<H)。然后你选择看的那个数字可能是偏小(T=L)或偏大(T=H)的数字。所以，共有六种可能的结果，如图19.3所示。

第二步:定义目标事件

获胜事件的四种结果已经标记在树状图中。

第三步:计算结果的概率

首先，计算边的概率。x过小的概率是L/n，过大的概率是(n-H)/n，刚刚好的概率是(H - L)/n。然后，你选择看的这个信封是大数还是小数的概率是一样的。将根到叶子路径上的概率相乘，就得到了结果的概率。

第四步:计算事件的概率

将获胜事件的四种结果的概率相加，就是你在这个游戏中的胜率。

由于大数H至少比小数L大1且它们不相等，所以最后的不等式成立。

19.3.4 二项分布

计算机科学领域中最常用的第三个分布是二项分布。

服从二项分布的随机变量，最有代表性的例子就是n次独立抛硬币结果正面朝上的次数。如果硬币是均匀的，那么正面朝上的次数服从无偏二项分布，概率密度函数为 $f_n:[0..n] →[0,1]$

这是因为n次抛硬币正好有k次正面朝上的序列有 $\binom{n}{k}$ 种，而且每个序列的概率是 $2^{-n}$ 。

广义二项分布

如果硬币是有偏好的,每一次抛到正面的概率是p,那么抛得正面的次数有一个广义二项分布密度函数，概率密度函数为 $f_{n,p}:[0..n]→[0,1]$

其中 $n ∈ N^+$ ,p ∈ [0,1]。k个正面、 n - k个反面的序列有 $\binom{n}{k}$ 个,每一个序列的概率是 $p^k(1-p)^{n-k}$ 。

19.4 期望

随机变量的期望或期望值，是指能够揭示这个变量很多行为的单个数字。随机变量的期望又称均值或平均数。

定义19.4.1：如果R是定义在样本空间S的随机变量,那么R的期望是:

19.4.1 均匀随机变量的期望值

一般来说,如果R,是均匀分布在 ${a_1 ,a_2,… , a_n}$ 上的随机变量,那么 $R_n$ 的期望就是 $a_i$ 的平均值:

19.4.2随机变量的倒数的期望

定义随机变量S为一个公平的六面骰子抛出的点数的倒数。也就是说S = 1/R，其中R是抛出的点数。那么，

注意：

19.4.3 指示器随机变量的期望值

一个事件的指示器随机变量的期望值就是这个事件的概率。

引理19.4.2：如果IA是事件A的指示器随机变量，那么

19.4.4期望的另一种定义

还有另一种定义期望的标准方法。

定理19.4.3 对任意的随机变量R,

证明．设R定义在样本空间S中，那么

19.4.5 条件期望

正如事件概率一样,期望也可以以某个事件为条件。对于随机变量R,给定事件A的条件下，R的期望值等于它在事件A结果上的概率加权平均。即，

定义19.4.4 给定事件A的条件下，随机变量R的条件期望Ex[R|A]是:

定理19.4.5（全期望定理)设R是样本空间S上的一个随机变量，并且 $A_1,A_2,…$ 是S的划分，那么

证明:

19.4.6平均故障时间

如果一个计算机程序还没崩溃,那么它每小时崩溃的概率是p。那么程序崩溃所需的期望时间是多少? 假设C是直到程序第一次崩溃的小时数，我们要求Ex[C]。

定义A为系统在第一个小时崩溃的事件，则 $\overline{A}$ 为第一个小时系统没有崩溃的事件。那么平均故障时间Ex[C]为

由于A表示第一个小时系统崩溃,故:

由于 $\overline{A}$ 是第一个小时系统没有崩溃，所以以 $\overline{A}$ 为条件，相当于第一个小时系统不崩溃，接着在没有条件的情况下重新开始。因此

故：

平均故障时间：

假设系统在各个时间周期内独立运行，如果系统在每一个时间周期发生故障的概率是p,那么系统第一次出现故障所需的时间期望是1/p。

定义19.4.6 随机变量C服从参数为p的几何分布，当且仅当陪域©= Z+且

引理19.4.7 如果随机变量C服从参数为p的几何分布，那么

19.4.7赌博游戏的预期收益

预期收益等于0的游戏，被称为公平游戏。

我们再来看一个公平游戏。

你和其他两名玩家玩游戏，每个玩家拿出2美元放在吧台，然后各自悄悄在纸巾上写“正”或“反”。接着，抛一枚公平的硬币。猜对硬币结果的人平分吧台上的6美元。

用四步法则和树状图计算一下预期收益。树状图如图19.6所示。

根据式19.3计算期望收益:

这说明这个游戏是公平的。

共谋的影响

如果另外两个人协商好，他们每次都选择不同的结果，你的期望收益会是多少呢？树状图如下

使用式19.3计算串谋情况下的期望收益,有:

19.5期望的线性性质

期望遵循一个简单、有用的法则，称为期望的线性性质。简单地说：就是随机变量和的期望等于随机变量期望的和。

定理19.5.1 对任意随机变量R1和R2，有:

定理19.5.2 对于随机变量R1,R2和常数a1,a2 ∈ R，有

也就是说，期望是一个线性函数。将以上定理拓展至两个以上变量的情况，可得

推论19.5.3（期望的线性性质)，对任意随机变量R1,…,Rg和常数a1
… , ax ∈R，有

19.5.1 两枚骰子的期望

两枚公平骰子抛出的点数和的期望是多少?

设随机变量 $R_1$ 是第一枚骰子抛出的点数， $R_2$ 是第二枚骰子抛出的点数。根据前面的计算我们知道，一枚骰子的期望值是3.5。使用期望的线性性质可得两枚骰子和的期望:

注意：不需要假设两个骰子是独立的。即使它们以某种可控的方式共同产生抛掷结果，只要这两个骰子都是公平的,那么它们的和的期望值就等于7。

19.5.2 指示器随机变量的和

期望的线性性质尤其适合指标器随机变量的和。举一个例子，假设有一个晚餐派对, n个男人检查他们的帽子。在就餐期间，帽子混在一起，随后每个人都会随机地得到一顶帽子。每个人以概率1/n拿到自己的帽子。请问能够正确拿到自己帽子的人有多少个?

将G表示为指示器随机变量的和。特别地，令 $G_i$ 表示事件“第i个人拿到自己帽子”的指示器随机变量。也就是说，如果第i个人得到自己的帽子，则 $G_i$ =1，否则 $G_i$ =0。那么得到自己的帽子的人数就是这些指示器随机变量的和:

这些指示器随机变量不是相互独立的。这里我们再强调一遍，不必考虑这些变量是否独立，期望的线性性质总是成立的。

由于 $G_i$ 是一个指示器随机变量，我们从引理19.4.2可以得出

所以

定理19.5.4：给定任意一系列事件A1,A-,… ,An，将要发生的事件数目的期望是

19.5.3二项分布的期望

假设独立地抛n个有偏好的硬币，每个硬币正面朝上的概率是p。那么正面朝上次数的期望是多少?

根据式19.3，这意味着

我们可以用期望的线性性质可以推导出一个简单闭型。

$J_i$ 表示第i个硬币正面朝上的指示器随机变量，即

那么正面向上的次数就是

由定理19.5.4

19.5.4 赠券收集问题

有多个颜色的火箭车。我们在点餐的时候得到的汽车颜色是随机且独立的。要想每种颜色的火箭车至少有一个，需要购买儿童套餐个数的期望是多少?

当有k种颜色的时候，每份儿童套餐附赠的车是我们已经有的颜色的概率是k/n。那么，每份套餐附赠新颜色的概率是1- k/n = (n -k)/n。因此，根据平均故障时间法则，一直买直到得到新颜色，所需套餐数量的预期是n/(n -k)。这意味着

结合期望的线性性质，我们可以解决赠券收集问题:

19.5.5 无限和

只要变量满足绝对收敛标准准则，期望的线性性质就同样适用于无限个随机变量的情况。

定理19.5.5（期望的线性性质）设 $R_0,R_1$ ,…为随机变量，且有

收敛，则

19.5.6赌博悖论

在美国，有一个名为轮盘赌轮的游戏。有18个黑色槽、18个红色槽、2个绿色槽，你可以压黑色或者红色。如果你压了10美元，并且压对了，你就可以10美元本金和10美元奖金。出现红色或者黑色的概率是18/38 ≈ 0.473。

当然，即使你有幸用一个概率为0.5的公平轮盘赌博，也不一定就能赢钱。假设使用公平轮盘，你每次下注赢和输的概率是一样的，所以每转一次期望收益是零。因此，继续下注，每一局期望收益的和仍然是零。

尽管如此,赌徒也会尝试不同的投注策略,以赢得轮盘赌。一个著名的策略是押注加倍( betdoubling )，比如下注10美元、红色，然后不断加倍，直到红色出现为止。这意味着如果第一次就转出红色，那么停止下注，赢得10美元并离开赌场。如果没有出现红色，第二次继续下注20美元。如果第二次转出红色，则得到20美元的本金加上20美元的回报，然后离开，净利润为20-10= 10美元。如果第二次还没有出现红色,继续下注40美元,如果第三次转出红色则离开，此时净利润是40一20 -10= 10美元,以此类推。

前面我们已经分析过公平轮盘赌根本赢不了钱，但这对不公平的轮盘赌不适用。