机器学习的数学基础(一)—— 期望、方差、协方差与相关系数

0. 期望与方差

期望:

E[aX+bY]=aE[X]+bE[Y]

方差:

D(aX+bY)=D(aX)+D(bY)+2cov(aX,bY)=a2D(X)+b2D(Y)+2abcov(X,Y)

D(aX+b)=a2D(X)

1. 协方差的定义及性质

期望值分别为 E[X] E[Y] 的两个实随机变量之间的协方差 cov(X,Y) 定义为:

cov(X,Y)==E[(XE[X])(YE[Y])]E[XY]E[X]E[Y]

也即,协方差表达的是两个随机变量总体误差的期望;

基本性质:

  • (1)如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

  • (2)如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足 E[XY]=E[X]E[Y] 。但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。协方差为0的两个随机变量称为是不相关的。

    独立一定不相关,不相关不一定独立;

cov(X,Y)=cov(Y,X)cov(aX,bY)=abcov(X,Y)cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)

2. 协方差与方差的关系

D(X+Y)=D(X)+D(Y)+2cov(X,Y)D(XY)=D(X)+D(Y)2cov(X,Y)

cov(X,X)=E[X2]E[X]2=D(X)

3. 相关系数

ρX,Y=cov(X,Y)σXσY

  • (1) ρX,Y=0 ,也即 cov(X,Y)=0 ,表示 X Y 不相关,也即 ρX,Y=0 的充分必要条件是 cov(X,Y)=0 ,也就不相关和协方差为 0是等价的;
  • (2) ρX,Y1
  • (3) ρX,Y=1 的充分必要条件是 P(Y=aX+b)=1 (也即二者线性相关)
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值