概率论于数理统计(陈希孺)笔记2.3

最新推荐文章于 2024-04-30 10:55:54 发布

清风疏影

最新推荐文章于 2024-04-30 10:55:54 发布

阅读量806

点赞数

文章标签：概率论

本文链接：https://blog.csdn.net/azxswq2541/article/details/120581194

版权

2.3 条件概率分布与随机变量的独立性

2.3.1 条件概率分布的概念

一个随机变量或向量 $X$ 的条件概率分布，就是在某种给定的条件之下， $X$ 的概率分布.

考虑之前提到的体重 $X_1$ 与身高 $X_2$ 的二维正态分布 $N\left(a, b, \sigma_{2}^{1}, \sigma_{2}^{2}, \rho\right)$ .根据之前的论述可以知道 $X_1$ , $X_2$ 都有单独的概率分布,分别为 $N\left(a, \sigma_{1}^{2}\right)$ 和 $N\left(b, \sigma_{2}^{2}\right)$ . 现在如限制 $\leqslant X_{2} \leqslant 1.8$ (米 ), 在这个条件下去求 $X_{1}$ 的条件分布,这就意味着要从这一大群人中把其身高在 $1.7$ 米和 $1.8$ 米的那些人都挑出来,然后在挑出的人群中求其体重的分布. 容易想像, 这个分布与不设这个条件的分布 (无条件分布)会很不一样.体重取大值的概率会显著增加.

从这个例子也看出条件分布这个概念的重要性.

2.3.2 离散型随机变量的条件概率分布

这个比较简单,直接给例子.

多项分布的条件概率分布

设 $\left(X_{1}, X_{2}, \cdots, X_{n}\right)$ 服从多项分布 $M\left(N ; p_{1}, \cdots,\right.$ , $p_{n}$ ). 在给定 $X_{2}=k_{2}$ 的条件下, $X_{1}$ 的条件分布为 $B\left(N-k_{2}, p_{1} /\left(1-p_{2}\right)\right)$

代数证明略去.这个公式的直观意义为在 $X_{2}=k_{2}$ 的条件下,剩下 $n - 1$ 个变量的联合分布就变为 $n-k_2$ 个物品分成 $n - 1$ 堆,每个物品分到第 $i$ 堆的概率从 $p_i$ 变成 $p_i/(1-p_2)$ .那么 $X_1$ 的条件分布就变为 $M\left(N-k_2 ; p_{1}/(1-p_2), p_{3}/(1-p_2), \cdots,p_{n}/(1-p_2)\right)$ 的边缘分布,即 $B\left(N-k_{2}, p_{1} /\left(1-p_{2}\right)\right)$

2.3.3 连续型随机变量的条件分布

连续型随机变量的条件分布函数如下

当 $a\neq b$ 时

$f_{1}\left(x_{1} \mid a \leqslant X_{2} \leqslant b\right)=\int_{a}^{b} f\left(x_{1}, t_{2}\right) \mathrm{d} t_{2} / \int_{a}^{b} f_{2}\left(t_{2}\right) \mathrm{d} t_{2}$

当 $a=b=x_2$ 时

$f\left(x_{1}\mid x_{2}\right)=f_{2}\left(x_{2}\right) f_{1}\left(x_{1} , x_{2}\right)$

可以记为
$f\left(x_{1}, x_{2}\right)=f_{2}\left(x_{2}\right) f_{1}\left(x_{1} \mid x_{2}\right)$
可以看出该公式对应于条件概率的公式 $\mid B)$

推广到任意多变量的场合

$f\left(x_{1}, \cdots, x_{n}\right)=g\left(x_{1}, \cdots, x_{k}\right) h\left(x_{k+1}, \cdots, x_{n} \mid x_{1}, \cdots, x_{k}\right)$

下面给出连续型随机变量的条件分布的例子

二维正态分布的条件分布

设 $\left(X_{1}, X_{2}\right)$ 服从二维正态分布 $N\left(a, b, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho\right)$ . 在给定 $X_{1}=x_{1}$ 的条件下, $X_{2}$ 的条件密度函数
$\begin{aligned} f_{2}\left(x_{2} \mid x_{1}\right)=& \frac{1}{\sqrt{2 \pi} \sigma_{2} \sqrt{1-\rho^{2}}} \\ & \cdot \exp \left[-\frac{\left(x_{2}-\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right)\right)\right)^{2}}{2\left(1-\rho^{2}\right) \sigma_{2}^{2}}\right] \end{aligned}$
这正是正态分布 $N\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right), \sigma_{2}^{2}\left(1-\rho^{2}\right)\right)$ 的概率密度函数.

由这里可以看出 $\rho$ 刻画了 $X_{1}, X_{2}$ 之间的相依关系.解释如下:

若 $\rho>0$ , 则随着 $x_{1}$ 的增加, $X_{2}$ (在 $X_{1}=x_{1}$ 之下) 的条件分布的中心点 $m\left(x_{1}\right)$ 随 $x_{1}$ 的增加而增加. 可以看出: 这意味着当 $x_{1}$ 增加时, $X_{2}$ 取大值的可能性增加, 即 $X_{2}$ 有随着 $X_{1}$ 的增长而增长.若 $\rho<0$ 则情况相反.若 $\rho=0$ 则无关.这从中心点的角度刻画了 $\rho$ 对 $X_1$ , $X_2$ 相依关系的刻画.

下图展示了 $X 1$ 分布为 $N\left(25, 64\right)$ 和 $X_2$ 分布为 $N\left(25, 64\right)$ 时,不同 $\rho$ 下二维正态分布的概率密度.

下图展示了 $r h o = 0.5$ 时, $X_1=15,25,35$ 下 $X_2$ 的条件分布
若 $|\rho|=0$ ,则 $\sigma=\sigma_2$ , $X_2$ 分布的集中程度不受 $X_1$ 影响.现在考虑极端情况,假如 $|\rho|=1$ ,那么 $\sigma=0$ ,由一维正态分布的性质可以知道 $X_2$ 的取值全部集中于 $m(X_1)$ .也就是说, $X_2$ 的取值由 $X_1$ 完全决定.这从集中程度的角度刻画了 $\rho$ 对 $X_1$ , $X_2$ 相依关系的刻画.

下图为 $\rho=0.999$ 时 $X_2$ 的条件分布

2.3.4 随机变量的独立性

定义 $3.1$ 设 $n$ 维随机向量 $\left(X_{1}, \cdots, X_{n}\right)$ 的联合密度函数为 $f\left(x_{1}, \cdots, x_{n}\right)$ , 而 $X_{i}$ 的(边缘)密度函数为 $f_{i}\left(x_{i}\right), i=1, \cdots, n$ . 如果
$f\left(x_{1}, \cdots, x_{n}\right)=f_{1}\left(x_{1}\right) \cdots f_{n}\left(x_{n}\right)$
就称随机变量 $X_{1}, \cdots, X_{n}$ 相互独立或简称独立

定义 3.2 设 $X_{1}, \cdots, X_{n}$ 都是离散型随机变量. 若对任何常数 $a_{1}, \cdots, a_{n}$ , 都有
$P\left(X_{1}=a_{1}, \cdots, X_{n}=a_{n}\right)=P\left(X_{1}=a_{1}\right) \cdots P\left(X_{n}=a_{n}\right)$
则称 $X_{1}, \cdots, X_{n}$ 相互独立

定理 $3.1$ 如果连续变量 $X_{1}, \cdots, X_{n}$ 独立时, 则对任何 $a_{i}<$ $b_{i}, i=1, \cdots, n$ , 由 $(3.14)$ 定义的 $n$ 个事件 $A_{1}, \cdots, A_{n}$ 也独立.

定理 $3.2$ 若连续型随机向量 $\left(X_{1}, \cdots, X_{n}\right)$ 的概率密度函数 $f\left(x_{1}, \cdots, x_{n}\right)$ 可表为 $n$ 个函数 $g_{1}, \cdots, g_{n}$ 之积, 其中 $g_{i}$ 只依赖于 $x_{i}$ , 即
$f\left(x_{1}, \cdots, x_{n}\right)=g_{1}\left(x_{1}\right) \cdots g_{n}\left(x_{n}\right)$
则 $X_{1}, \cdots, X_{n}$ 相互独立,且 $X_{i}$ 的边缘密度函数 $f_{i}\left(x_{i}\right)$ 与 $g_{i}\left(x_{i}\right)$ 只相差一个党数因子

定理 $3.3$ 若 $X_{1}, \cdots, X_{n}$ 相互独立,而
$Y_{1}=g_{1}\left(X_{1}, \cdots, X_{m}\right), Y_{2}=g_{2}\left(X_{m+1}, \cdots, X_{n}\right)$
则 $Y_{1}$ 和 $Y_{2}$ 独立.

清风疏影

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
概率论于数理统计(陈希孺)笔记2.3

2.3 条件概率分布与随机变量的独立性2.3.1 条件概率分布的概念一个随机变量或向量XXX的条件概率分布，就是在某种给定的条件之下，XXX的概率分布.考虑之前提到的体重X1X_1X1与身高X2X_2X2的二维正态分布N(a,b,σ21,σ22,ρ)N\left(a, b, \sigma_{2}^{1}, \sigma_{2}^{2}, \rho\right)N(a,b,σ21,σ22,ρ).根据之前的论述可以知道X1X_1X1,X2X_2X2都有单独的概率分布,分别为N(a,σ12)N\
复制链接

扫一扫