二维正态分布参数rho的作用

最新推荐文章于 2024-04-30 10:55:54 发布

清风疏影

最新推荐文章于 2024-04-30 10:55:54 发布

阅读量1.1w

点赞数 3

分类专栏：概率论与数理统计文章标签：概率论

本文链接：https://blog.csdn.net/azxswq2541/article/details/120581174

版权

概率论与数理统计专栏收录该内容

3 篇文章

订阅专栏

二维正态分布参数 $\rho$ 的作用

我们知道,一个随机向量 $X =$ $\left(X_{1}, \cdots, X_{n}\right)$ 的分布 $F$ 足以决定其任一分量 $X_{i}$ 的 $\left(\right.$ 边缘)分布 $F_{i}$ , 但反过来不对: 即使知道了所有 $X_{i}$ 的边缘分布 $F_{i}, i=1, \cdots, n$ , 也不足以决定 $X$ 的分布 $F$ .而二维正态分布就是一个典型例子.

例如,考察边际分布为 $N\left(25, 16\right)$ 和 $N\left(25, 64\right)$ 在不同 $\rho$ 下的联合分布.下面三张图展示了 $\rho=0,0.5,-0.5$ 时对应的概率密度.他们显然是不同的分布.

那么,为什么 $\rho$ 不同,分布就不同?书中给出的解释是 $\rho$ 刻画了两个分量 $X_1$ , $X_2$ 的关系,不同的关系导致不同的联合分布.那么,究竟是如何刻画的呢?我认为可以从两个角度考察.

中心点

设 $\left(X_{1}, X_{2}\right)$ 服从二维正态分布 $N\left(a, b, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho\right)$ . 在给定 $X_{1}=x_{1}$ 的条件下, $X_{2}$ 的条件密度函数
$\begin{aligned} f_{2}\left(x_{2} \mid x_{1}\right)=& \frac{1}{\sqrt{2 \pi} \sigma_{2} \sqrt{1-\rho^{2}}} \\ & \cdot \exp \left[-\frac{\left(x_{2}-\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right)\right)\right)^{2}}{2\left(1-\rho^{2}\right) \sigma_{2}^{2}}\right] \end{aligned}$
这正是正态分布 $N\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right), \sigma_{2}^{2}\left(1-\rho^{2}\right)\right)$ 的概率密度函数.

根据这个公式,我们可以推出,若 $\rho>0$ , 则随着 $x_{1}$ 的增加, $X_{2}$ (在 $X_{1}=x_{1}$ 之下) 的条件分布的中心点 $m\left(x_{1}\right)$ 随 $x_{1}$ 的增加而增加. 可以看出: 这意味着当 $x_{1}$ 增加时, $X_{2}$ 取大值的可能性增加, 即 $X_{2}$ 有随着 $X_{1}$ 的增长而增长.若 $\rho<0$ 则情况相反.若 $\rho=0$ 则无关.

回到之前的例子,我们考察 $r h o = 0.5$ 时, $X_1=15,25,35$ 下 $X_2$ 的条件分布.结果如下.可以看到,随着 $x_1$ 的增加, $X_2$ 的条件分布的中心值不断右移.

集中程度

根据公式 $N\left(b+\rho \sigma_{2} \sigma_{1}^{-1}\left(x_{1}-a\right), \sigma_{2}^{2}\left(1-\rho^{2}\right)\right)$ 可知条件分布的参数 $\sigma=\sigma_{2}^{2}\left(1-\rho^{2}\right)$ .而 $\sigma$ 刻画了数据的集中程度. $|\sigma|$ 越大,数据越是集中于中心点.

若 $|\rho|=0$ ,则 $\sigma=\sigma_2$ ,说明 $X_2$ 分布的集中程度不受 $X_1$ 影响.现在考虑极端情况,假如 $|\rho|=1$ ,那么 $\sigma=0$ ,由一维正态分布的性质可以知道 $X_2$ 的取值全部集中于 $m(X_1)$ .也就是说, $X_2$ 是 $X_1$ 的函数,其取值由 $X_1$ 完全决定.