概率论知识回顾（十八）：协方差和相关系数_用柯西不等式证明方差存在则协方差存在-CSDN博客

本文链接：https://blog.csdn.net/wangpengfei_p/article/details/92799479

概率论知识回顾（十八）

重点：协方差和相关系数

知识回顾用于巩固知识和查漏补缺。知识回顾步骤：

查看知识回顾中的问题，尝试自己解答
自己解答不出来的可以查看下面的知识解答巩固知识。
对知识解答有疑问的，说明有关这一点的知识或者公式没有理解透彻或者没有记住，要重新翻看书籍。

知识回顾

协方差的公式定义是什么？协方差是用来衡量什么的？
当两个随机变量相互独立的时候，协方差的值是什么？简要证明并尝试列举和方差的关系。
简述柯西–许瓦兹不等式以及不等式等号成立条件的证明。
相关系数的公式定义是什么？它又是用来衡量什么的？为什么要是用相关系数？
给出随机变量 $X, Y$ 不相关的几条等价表示。
给出相关系数 $\rho_{XY}$ 两条性质的证明。

知识解答

协方差的公式定义是什么？协方差是用来衡量什么的？
- 公式定义 $C o v (X, Y) = E [(X - E X) (Y - E Y)]$
- 协方差用来衡量随机变量之间的相关关系的，如果 $C o v (X, Y) = 0$ , 就可以说两个随机变量之间不相关。
- 由于独立的要求比相关更严格，即：独立一定不相关，但不相关不一定独立。那么我们就可以进行断行
  - 如果两个随机变量具有某种相关关系，那么他们一定不相互独立。
  - 如果两个随机变量相互独立，那么他们就一定相关。
当两个随机变量相互独立的时候，协方差的值是什么？简要证明并尝试列举和方差的关系。
- 在第一个问题中已经得到了解答，当两个随机变量相互独立的时候，一定是不相关的，那么 $C o v (X, Y) = 0$ .
证明：首先，我们分解 $C o v (X, Y)$ 就有：

$\begin{aligned} Cov(X, Y) &= E(XY) - XE(Y) - YE(X) + E(X)E(Y) \\&= E(XY) - 2E(X)E(Y) + E(X)E(Y) \\&= E(XY) - E(X)E(Y) \end{aligned}$

同时，如果 $X, Y$ 相互独立的话，有 $E (X Y) = E (X) E (Y)$ , 因此就可知 $C o v (X, Y) = 0$
- 另外，从协方差的定义中可以看到，当 $X = Y$ 的时候， $C o v (X, Y) = D (X)$
- $D (X + Y) = D (X) + D (Y) + 2 C o v (X, Y)$
证明：（从一般情况得到两个随机变量的情况）

由于有 $D (X) = C o v (X, X)$ 因此可知 $D(\sum_{i=1}^nX_i) = Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j)$

上面的公式是把 $\sum_{i=1}^nX_i$ 看做一个随机变量，这时候 $\sum_{i=1}^nX_i$ 和 $\sum_{i=j}^nX_j$ 是相等的。

同时，根据协方差的性质， $Cov(\sum_{i=1}^na_iX_i, \sum_{j=1}^mb_jY_j) = \sum_{i=1}^n\sum_{j=1}^ma_ib_jCov(X_i, Y_j)$

就有：
$\begin{aligned}Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) &= \sum_{i=1}^n\sum_{j=1}^nCov(X_i, X_j) \\&=\sum_{i=1}^nCov(X_i, X_i) + {\sum\sum}_{i\neq j}Cov(X_i, X_j) \\&= \sum_{i=1}^nD(X_i) + 2{\sum\sum}_{ 1\le i < j \le n}Cov(X_i, X_j) \end{aligned}$

从上面的一般式就可以得出 n = 2 的情况。
简述柯西–许瓦兹不等式以及不等式等号成立条件的证明。
- 对任意的随机变量 $X, Y$ , 若 $E(X^2) < + \infty, E(Y^2) < +\infty$ , 则有 $[E(XY)]^2 \le E(X^2)·E(Y^2)$ , 当且仅当 $P\{Y = t_0X\} = 1$ 时等号成立，其中 $t_0$ 为某常数。
  
  证明：令 $u(t) = E(tX - Y)^2 = t^2E(X^2) - 2tE(XY) + E(Y^2)$ 可以知道 $u (t)$ 没有实根或者只有一个重根。因此就有 $\Delta = [2E(XY)]^2 - 4E(X^2)E(Y^2) \le 0 \leftrightarrow [E(XY)]^2 \le E(X^2)·E(Y^2)$
  
  如果 $\Delta = 0$ , 就有存在一个 $t_0$ 使得 $E(tX-Y)^2=0$
  
  同时，有 $\le D(t_0X-Y) = E(t_0X-Y)^2 - [E(t_0X-Y)]^2 = -[E(t_0X-Y)]^2 \le 0$
  
  因此可知 $D(t_0X-Y) = 0, E(t_0X-Y)=0$
  
  根据方差的性质有： $D (X) = 0$ 的充要条件是存在常数C使得 $P\{X=C\}=1$ , 其中 $C = E (X)$
  
  这里，我们使 $Z = t_0X-Y$ 有 $D (Z) = 0, E (Z) = 0$ 因此有 $P\{Z=0\}=1 \leftrightarrow P\{t_0X-Y=0\} = 1 \leftrightarrow P\{t_0X=Y\}=1$
- 将上面的公式里面的 $X$ 替换成 $X - E (X)$ , $Y$ 替换成 $Y - E (Y)$ 就有 $Y)]^2 \le D(X)D(Y)$
相关系数的公式定义是什么？它又是用来衡量什么的？为什么要是用相关系数？
- $\rho_{XY} = \frac{Cov(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}} = Cov(\frac{X-E(X)}{\sqrt{D(X)}},\frac{Y-E(Y)}{\sqrt{D(Y)}}) = Cov(X^*, Y^*)$
- 相关系数和协方差的关系就类似于变异系数和方差的关系一样，它是协方差的标准化表示，也是表示随机变量之间相关关系的表示，于协方差不同的是，协方差容易受随机变量本身数值大小的影响，由于相关系数是进行标准化后的度量，因此可以更好的度量相关关系。
给出随机变量 $X, Y$ 不相关的几条等价表示。
- $C o v (X, Y) = 0$
- $\rho_{XY} = 0$
- $\pm Y) = D(X) + D(Y)$
- $E (X Y) = E (X) E (Y)$
给出相关系数 $\rho_{XY}$ 两条性质的证明。
- $|\rho_{XY}| \le 1$
  
  证明：令 $X^* = \frac{X-E(X)}{\sqrt{D(X)}},Y^* = \frac{Y-E(Y)}{\sqrt{D(Y)}}$ 。有 $D(X^*) = 1, D(Y^*)=1$
  
  同时，根据第三问中的结论 $Y)]^2 \le D(X)D(Y)$ 可知 $\rho_{XY}^2 \le D(X^*)D(Y^*) = 1$
  
  因此可知 $|\rho_{XY}| \le 1$
- $|\rho_{XY}| = 1$ 的充要条件是 X 与 Y 以概率 1 线性相关，即存在常数 a 和 b 使得 $P\{Y = aX + b\} = 1$ 。即
  - $\rho_{XY} = 1$ 当且仅当 $P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = \frac{X-E(X)}{\sqrt{D(X)}}\} = 1$
  - $\rho_{XY} = -1$ 当且仅当 $P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = -\frac{X-E(X)}{\sqrt{D(X)}}\} = 1$
  证明：
  
  $|\rho_{XY}| = 1 \leftrightarrow \rho_{XY}^2 = 1 \leftrightarrow [E(X^*Y^*) - E(X^*)E(Y^*)]^2=1$
  
  同时，由于 $E(X^*) = E(Y^*)=0, E(X^*)^2 = E(Y^*)^2=1$
  
  可以知道
  
  $E(X^*Y^*) - E(X^*)E(Y^*)]^2 = [E(X^*Y^*)]^2 = 1 = E(X^*)^2E(Y^*)^2$
  
  根据柯西–许瓦兹不等式我们知道，满足上面等式的当且仅当存在 $t_0$ 使得 $P\{Y^* = CX^*\} =1$
  
  因此有
  
  $P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = C\frac{X-E(X)}{\sqrt{D(X)}}\} \leftrightarrow P\{Y = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}X + (E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}})\}$
  
  根据上面的公式，很明显，令 $C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}, b= E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}$ 就能得到 $Y = a X + b$
  
  同理，根据 $\rho_{XY} = 1$ 有 $Y^* = CX^*$
  
  就有 $Cov(X^*, Y^*) = Cov(X^*, CX^*) = CD(X*) = C = 1$ , 证毕。
  
  同理当 $\rho_{XY} = -1$ 也可证明。