概率论知识回顾(十八):协方差和相关系数

概率论知识回顾(十八)

重点:协方差和相关系数

知识回顾用于巩固知识和查漏补缺。知识回顾步骤:

  1. 查看知识回顾中的问题,尝试自己解答
  2. 自己解答不出来的可以查看下面的知识解答巩固知识。
  3. 对知识解答有疑问的,说明有关这一点的知识或者公式没有理解透彻或者没有记住,要重新翻看书籍。

知识回顾

  1. 协方差的公式定义是什么?协方差是用来衡量什么的?
  2. 当两个随机变量相互独立的时候,协方差的值是什么?简要证明并尝试列举和方差的关系。
  3. 简述柯西–许瓦兹不等式以及不等式等号成立条件的证明。
  4. 相关系数的公式定义是什么?它又是用来衡量什么的?为什么要是用相关系数?
  5. 给出随机变量 X , Y X,Y X,Y 不相关的几条等价表示。
  6. 给出相关系数 ρ X Y \rho_{XY} ρXY 两条性质的证明。

知识解答

  1. 协方差的公式定义是什么?协方差是用来衡量什么的?

    • 公式定义 C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] Cov(X, Y) = E[(X-EX)(Y-EY)] Cov(X,Y)=E[(XEX)(YEY)]
    • 协方差用来衡量随机变量之间的相关关系的,如果 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0, 就可以说两个随机变量之间不相关。
    • 由于独立的要求比相关更严格,即:独立一定不相关,但不相关不一定独立。那么我们就可以进行断行
      • 如果两个随机变量具有某种相关关系,那么他们一定不相互独立。
      • 如果两个随机变量相互独立,那么他们就一定相关。
  2. 当两个随机变量相互独立的时候,协方差的值是什么?简要证明并尝试列举和方差的关系。

    • 在第一个问题中已经得到了解答,当两个随机变量相互独立的时候,一定是不相关的,那么 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0.

    证明:首先,我们分解 C o v ( X , Y ) Cov(X, Y) Cov(X,Y) 就有:

    C o v ( X , Y ) = E ( X Y ) − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − 2 E ( X ) E ( Y ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned} Cov(X, Y) &= E(XY) - XE(Y) - YE(X) + E(X)E(Y) \\&= E(XY) - 2E(X)E(Y) + E(X)E(Y) \\&= E(XY) - E(X)E(Y) \end{aligned} Cov(X,Y)=E(XY)XE(Y)YE(X)+E(X)E(Y)=E(XY)2E(X)E(Y)+E(X)E(Y)=E(XY)E(X)E(Y)

    同时,如果 X , Y X,Y X,Y 相互独立的话,有 E ( X Y ) = E ( X ) E ( Y ) E(XY) = E(X)E(Y) E(XY)=E(X)E(Y) , 因此就可知 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0

    • 另外,从协方差的定义中可以看到 , 当 X = Y X=Y X=Y 的时候, C o v ( X , Y ) = D ( X ) Cov(X, Y) = D(X) Cov(X,Y)=D(X)
    • D ( X + Y ) = D ( X ) + D ( Y ) + 2 C o v ( X , Y ) D(X + Y) = D(X) + D(Y) + 2Cov(X, Y) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

    证明: (从一般情况得到两个随机变量的情况)

    由于有 D ( X ) = C o v ( X , X ) D(X) = Cov(X, X) D(X)=Cov(X,X) 因此可知 D ( ∑ i = 1 n X i ) = C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) D(\sum_{i=1}^nX_i) = Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) D(i=1nXi)=Cov(i=1nXi,j=1nXj)

    上面的公式是把 ∑ i = 1 n X i \sum_{i=1}^nX_i i=1nXi 看做一个随机变量,这时候 ∑ i = 1 n X i \sum_{i=1}^nX_i i=1nXi ∑ i = j n X j \sum_{i=j}^nX_j i=jnXj 是相等的。

    同时,根据协方差的性质, C o v ( ∑ i = 1 n a i X i , ∑ j = 1 m b j Y j ) = ∑ i = 1 n ∑ j = 1 m a i b j C o v ( X i , Y j ) Cov(\sum_{i=1}^na_iX_i, \sum_{j=1}^mb_jY_j) = \sum_{i=1}^n\sum_{j=1}^ma_ib_jCov(X_i, Y_j) Cov(i=1naiXi,j=1mbjYj)=i=1nj=1maibjCov(Xi,Yj)

    就有:
    C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) = ∑ i = 1 n ∑ j = 1 n C o v ( X i , X j ) = ∑ i = 1 n C o v ( X i , X i ) + ∑ ∑ i ≠ j C o v ( X i , X j ) = ∑ i = 1 n D ( X i ) + 2 ∑ ∑ 1 ≤ i &lt; j ≤ n C o v ( X i , X j ) \begin{aligned}Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) &amp;= \sum_{i=1}^n\sum_{j=1}^nCov(X_i, X_j) \\&amp;=\sum_{i=1}^nCov(X_i, X_i) + {\sum\sum}_{i\neq j}Cov(X_i, X_j) \\&amp;= \sum_{i=1}^nD(X_i) + 2{\sum\sum}_{ 1\le i &lt; j \le n}Cov(X_i, X_j) \end{aligned} Cov(i=1nXi,j=1nXj)=i=1nj=1nCov(Xi,Xj)=i=1nCov(Xi,Xi)+i̸=jCov(Xi,Xj)=i=1nD(Xi)+21i<jnCov(Xi,Xj)

    从上面的一般式就可以得出 n = 2 的情况。

  3. 简述柯西–许瓦兹不等式以及不等式等号成立条件的证明。

    • 对任意的随机变量 X , Y X, Y X,Y, 若 E ( X 2 ) &lt; + ∞ , E ( Y 2 ) &lt; + ∞ E(X^2) &lt; + \infty, E(Y^2) &lt; +\infty E(X2)<+,E(Y2)<+, 则有 [ E ( X Y ) ] 2 ≤ E ( X 2 ) ⋅ E ( Y 2 ) [E(XY)]^2 \le E(X^2)·E(Y^2) [E(XY)]2E(X2)E(Y2), 当且仅当 P { Y = t 0 X } = 1 P\{Y = t_0X\} = 1 P{Y=t0X}=1 时等号成立,其中 t 0 t_0 t0 为某常数。

      证明:令 u ( t ) = E ( t X − Y ) 2 = t 2 E ( X 2 ) − 2 t E ( X Y ) + E ( Y 2 ) u(t) = E(tX - Y)^2 = t^2E(X^2) - 2tE(XY) + E(Y^2) u(t)=E(tXY)2=t2E(X2)2tE(XY)+E(Y2) 可以知道 u ( t ) u(t) u(t) 没有实根或者只有一个重根。因此就有 Δ = [ 2 E ( X Y ) ] 2 − 4 E ( X 2 ) E ( Y 2 ) ≤ 0 ↔ [ E ( X Y ) ] 2 ≤ E ( X 2 ) ⋅ E ( Y 2 ) \Delta = [2E(XY)]^2 - 4E(X^2)E(Y^2) \le 0 \leftrightarrow [E(XY)]^2 \le E(X^2)·E(Y^2) Δ=[2E(XY)]24E(X2)E(Y2)0[E(XY)]2E(X2)E(Y2)

      如果 Δ = 0 \Delta = 0 Δ=0, 就有 存在一个 t 0 t_0 t0 使得 E ( t X − Y ) 2 = 0 E(tX-Y)^2=0 E(tXY)2=0

      同时,有 0 ≤ D ( t 0 X − Y ) = E ( t 0 X − Y ) 2 − [ E ( t 0 X − Y ) ] 2 = − [ E ( t 0 X − Y ) ] 2 ≤ 0 0 \le D(t_0X-Y) = E(t_0X-Y)^2 - [E(t_0X-Y)]^2 = -[E(t_0X-Y)]^2 \le 0 0D(t0XY)=E(t0XY)2[E(t0XY)]2=[E(t0XY)]20

      因此可知 D ( t 0 X − Y ) = 0 , E ( t 0 X − Y ) = 0 D(t_0X-Y) = 0, E(t_0X-Y)=0 D(t0XY)=0,E(t0XY)=0

      根据方差的性质有: D ( X ) = 0 D(X)=0 D(X)=0的充要条件是存在常数C使得 P { X = C } = 1 P\{X=C\}=1 P{X=C}=1, 其中 C = E ( X ) C = E(X) C=E(X)

      这里,我们使 Z = t 0 X − Y Z = t_0X-Y Z=t0XY D ( Z ) = 0 , E ( Z ) = 0 D(Z) = 0, E(Z) = 0 D(Z)=0,E(Z)=0 因此有 P { Z = 0 } = 1 ↔ P { t 0 X − Y = 0 } = 1 ↔ P { t 0 X = Y } = 1 P\{Z=0\}=1 \leftrightarrow P\{t_0X-Y=0\} = 1 \leftrightarrow P\{t_0X=Y\}=1 P{Z=0}=1P{t0XY=0}=1P{t0X=Y}=1

    • 将上面的公式里面的 X X X 替换成 X − E ( X ) X-E(X) XE(X), Y Y Y 替换成 Y − E ( Y ) Y - E(Y) YE(Y) 就有 [ C o v ( X , Y ) ] 2 ≤ D ( X ) D ( Y ) [Cov(X, Y)]^2 \le D(X)D(Y) [Cov(X,Y)]2D(X)D(Y)

  4. 相关系数的公式定义是什么?它又是用来衡量什么的?为什么要是用相关系数?

    • ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) = C o v ( X − E ( X ) D ( X ) , Y − E ( Y ) D ( Y ) ) = C o v ( X ∗ , Y ∗ ) \rho_{XY} = \frac{Cov(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}} = Cov(\frac{X-E(X)}{\sqrt{D(X)}},\frac{Y-E(Y)}{\sqrt{D(Y)}}) = Cov(X^*, Y^*) ρXY=D(X) D(Y) Cov(X,Y)=Cov(D(X) XE(X),D(Y) YE(Y))=Cov(X,Y)
    • 相关系数和协方差的关系就类似于变异系数和方差的关系一样,它是协方差的标准化表示,也是表示随机变量之间相关关系的表示,于协方差不同的是,协方差容易受随机变量本身数值大小的影响,由于相关系数是进行标准化后的度量,因此可以更好的度量相关关系。
  5. 给出随机变量 X , Y X,Y X,Y 不相关的几条等价表示。

    • C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0
    • ρ X Y = 0 \rho_{XY} = 0 ρXY=0
    • D ( X ± Y ) = D ( X ) + D ( Y ) D(X \pm Y) = D(X) + D(Y) D(X±Y)=D(X)+D(Y)
    • E ( X Y ) = E ( X ) E ( Y ) E(XY) = E(X)E(Y) E(XY)=E(X)E(Y)
  6. 给出相关系数 ρ X Y \rho_{XY} ρXY 两条性质的证明。

    • ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \le 1 ρXY1

      证明:令 X ∗ = X − E ( X ) D ( X ) , Y ∗ = Y − E ( Y ) D ( Y ) X^* = \frac{X-E(X)}{\sqrt{D(X)}},Y^* = \frac{Y-E(Y)}{\sqrt{D(Y)}} X=D(X) XE(X),Y=D(Y) YE(Y)。 有 D ( X ∗ ) = 1 , D ( Y ∗ ) = 1 D(X^*) = 1, D(Y^*)=1 D(X)=1,D(Y)=1

      同时,根据第三问中的结论 [ C o v ( X , Y ) ] 2 ≤ D ( X ) D ( Y ) [Cov(X, Y)]^2 \le D(X)D(Y) [Cov(X,Y)]2D(X)D(Y) 可知 ρ X Y 2 ≤ D ( X ∗ ) D ( Y ∗ ) = 1 \rho_{XY}^2 \le D(X^*)D(Y^*) = 1 ρXY2D(X)D(Y)=1

      因此可知 ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \le 1 ρXY1

    • ∣ ρ X Y ∣ = 1 |\rho_{XY}| = 1 ρXY=1 的充要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 和 b 使得 P { Y = a X + b } = 1 P\{Y = aX + b\} = 1 P{Y=aX+b}=1。即

      • ρ X Y = 1 \rho_{XY} = 1 ρXY=1 当且仅当 P { Y − E ( Y ) D ( Y ) = X − E ( X ) D ( X ) } = 1 P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = \frac{X-E(X)}{\sqrt{D(X)}}\} = 1 P{D(Y) YE(Y)=D(X) XE(X)}=1
      • ρ X Y = − 1 \rho_{XY} = -1 ρXY=1 当且仅当 P { Y − E ( Y ) D ( Y ) = − X − E ( X ) D ( X ) } = 1 P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = -\frac{X-E(X)}{\sqrt{D(X)}}\} = 1 P{D(Y) YE(Y)=D(X) XE(X)}=1

      证明:

      ∣ ρ X Y ∣ = 1 ↔ ρ X Y 2 = 1 ↔ [ E ( X ∗ Y ∗ ) − E ( X ∗ ) E ( Y ∗ ) ] 2 = 1 |\rho_{XY}| = 1 \leftrightarrow \rho_{XY}^2 = 1 \leftrightarrow [E(X^*Y^*) - E(X^*)E(Y^*)]^2=1 ρXY=1ρXY2=1[E(XY)E(X)E(Y)]2=1

      同时,由于 E ( X ∗ ) = E ( Y ∗ ) = 0 , E ( X ∗ ) 2 = E ( Y ∗ ) 2 = 1 E(X^*) = E(Y^*)=0, E(X^*)^2 = E(Y^*)^2=1 E(X)=E(Y)=0,E(X)2=E(Y)2=1

      可以知道

      [ E ( X ∗ Y ∗ ) − E ( X ∗ ) E ( Y ∗ ) ] 2 = [ E ( X ∗ Y ∗ ) ] 2 = 1 = E ( X ∗ ) 2 E ( Y ∗ ) 2 [E(X^*Y^*) - E(X^*)E(Y^*)]^2 = [E(X^*Y^*)]^2 = 1 = E(X^*)^2E(Y^*)^2 [E(XY)E(X)E(Y)]2=[E(XY)]2=1=E(X)2E(Y)2

      根据 柯西–许瓦兹不等式我们知道,满足上面等式的当且仅当存在 t 0 t_0 t0 使得 P { Y ∗ = C X ∗ } = 1 P\{Y^* = CX^*\} =1 P{Y=CX}=1

      因此有

      P { Y − E ( Y ) D ( Y ) = C X − E ( X ) D ( X ) } ↔ P { Y = C D ( Y ) D ( X ) X + ( E ( Y ) − C E ( X ) D ( Y ) D ( X ) ) } P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = C\frac{X-E(X)}{\sqrt{D(X)}}\} \leftrightarrow P\{Y = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}X + (E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}})\} P{D(Y) YE(Y)=CD(X) XE(X)}P{Y=CD(X) D(Y) X+(E(Y)CE(X)D(X) D(Y) )}

      根据上面的公式,很明显,令 a = C D ( Y ) D ( X ) , b = E ( Y ) − C E ( X ) D ( Y ) D ( X ) a = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}, b= E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}} a=CD(X) D(Y) ,b=E(Y)CE(X)D(X) D(Y) 就能得到 Y = a X + b Y = aX+b Y=aX+b

      同理,根据 ρ X Y = 1 \rho_{XY} = 1 ρXY=1 Y ∗ = C X ∗ Y^* = CX^* Y=CX

      就有 C o v ( X ∗ , Y ∗ ) = C o v ( X ∗ , C X ∗ ) = C D ( X ∗ ) = C = 1 Cov(X^*, Y^*) = Cov(X^*, CX^*) = CD(X*) = C = 1 Cov(X,Y)=Cov(X,CX)=CD(X)=C=1, 证毕。

      同理当 ρ X Y = − 1 \rho_{XY} = -1 ρXY=1 也可证明。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值