机器学习|协方差与相关系数|15mins入门|概统学习笔记(十二)

协方差与相关系数

  • 背景:对于多维随机变量,反映分量之间关系的数字特征中,最重要的是协方差和相关系数

1.协方差

  • 定义:任意两个随机变量X和Y的协方差,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)定义为
    C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{[XE(X)][YE(Y)]}

  • 性质:

    1. C o v ( X , Y ) = C o v ( Y , X ) Cov(X,Y)=Cov(Y,X) Cov(X,Y)=Cov(Y,X)
    2. C o v ( a X , b Y ) = a b C o v ( X , Y ) a , b 是 常 数 Cov(aX,bY)=abCov(X,Y) \quad a,b 是常数 Cov(aX,bY)=abCov(X,Y)a,b
    3. C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
  • 计算协方差公式:

    由协方差的定义及期望的性质,可得
    C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\} \\ =E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y) \\ =E(XY) - E(X)E(Y) Cov(X,Y)=E{[XE(X)][YE(Y)]}=E(XY)E(X)E(Y)E(Y)E(X)+E(X)E(Y)=E(XY)E(X)E(Y)
    可见,若X与Y独立,则 C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0

  • 随机变量和的方差与协方差的关系
    D ( X + Y ) = D ( X ) + D ( Y ) + 2 C o v ( X , Y ) D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) + 2 ∑ ∑ i < j C o v ( X i , X j ) D(X+Y)=D(X)+D(Y)+2Cov(X,Y) \\ D(\sum_{i=1}^nX_i)=\sum_{i=1}^nD(X_i)+2\sum\sum_{i<j}Cov(X_i,X_j) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)D(i=1nXi)=i=1nD(Xi)+2i<jCov(Xi,Xj)
    X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn两两独立,则上式化为
    D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) D(\sum_{i=1}^nX_i)=\sum_{i=1}^nD(X_i) D(i=1nXi)=i=1nD(Xi)

2. 相关系数

  • 背景:协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响。例如:
    C o v ( k X , k Y ) = k 2 C o v ( X , Y ) Cov(kX,kY)=k^2Cov(X,Y) Cov(kX,kY)=k2Cov(X,Y)
    为了克服这一缺点,对协方差进行标准化,引入了相关系数

  • 定义:设 D ( X ) > 0 , D ( Y ) > 0 D(X)>0,D(Y)>0 D(X)>0,D(Y)>0,称
    ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) \rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} ρXY=D(X)D(Y) Cov(X,Y)
    为随机变量X和Y的相关系数,记 ρ X Y \rho_{XY} ρXY ρ \rho ρ

  • 相关系数的性质:

    1. ∣ ρ ∣ ≤ 1 |\rho|\leq 1 ρ1
    2. X和Y独立时, ρ = 0 \rho=0 ρ=0,但其逆命题不一定成立
    3. | ρ \rho ρ|=1,即存在常数 a , b ( b ≠ 0 ) a,b(b\neq 0) a,b(b=0),使 P Y = a + b X = 1 P{Y=a+bX}=1 PY=a+bX=1,即X和Y以概率1线性相关
  • 独立与相关的关系:

    • 若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立

      但若 ( X , Y ) (X,Y) (X,Y)服从二维正态分布,则独立与不相关等价

  • 意义:相关系数刻画了X和Y间”线性相关“的程度

  • 考虑以X的线性函数 a + b X a+bX a+bX来近似表示Y,以均方误差 e = E [ Y − ( a + b X ) ] 2 e=E{[Y-(a+bX)]^2} e=E[Y(a+bX)]2来衡量以 a + b X a+bX a+bX近似表达Y的好坏程度。

    e值越小表示 a + b X a+bX a+bX与Y的近似程度越好。通常用微积分中求极值的方法,求出使e达到最小时的a,b。

    证明:
    e = E [ Y − ( a + b X ) ] 2 = E ( Y 2 ) + b 2 E ( X 2 ) + a 2 − 2 b E ( X Y ) + 2 a b E ( X ) − 2 a E ( Y ) e=E{[Y-(a+bX)]^2}=E(Y^2)+b^2E(X^2)+a^2-2bE(XY)+2abE(X)-2aE(Y) e=E[Y(a+bX)]2=E(Y2)+b2E(X2)+a22bE(XY)+2abE(X)2aE(Y)

    { ∂ e ∂ a = 2 a + 2 b E ( X ) − 2 E ( Y ) = 0 ∂ e ∂ b = 2 b E ( X 2 ) − 2 E ( X Y ) + 2 a E ( X ) = 0 \begin{cases} \frac{\partial e}{\partial a}=2a+2bE(X)-2E(Y)=0 \\ \frac{\partial e}{\partial b}=2bE(X^2)-2E(XY)+2aE(X)=0 \end{cases} {ae=2a+2bE(X)2E(Y)=0be=2bE(X2)2E(XY)+2aE(X)=0
    解得
    { b 0 = C o v ( X , Y ) D ( X ) a 0 = E ( Y ) − b 0 E ( X ) \begin{cases} b_0=\frac{Cov(X,Y)}{D(X)} \\ a_0=E(Y)-b_0E(X) \end{cases} {b0=D(X)Cov(X,Y)a0=E(Y)b0E(X)
    这样求出的最佳逼近为
    L ( X ) = a 0 + b 0 X L(X)=a_0+b_0X L(X)=a0+b0X

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值