第四章 随机变量的数字特征之协方差与相关系数

 

在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量X与Y之间的协方差定义为:

  COV(X,Y)=E[(X-E(X))(Y-E(Y))]

       如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。

  如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

  如果X与Y是统计独立的,那么二者之间的协方差就是0。

  但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。

 

----------------------------------------------------------------------------------------------------------------

 

协方差虽然一定程度上描述了两变量的相关性,但协方差是具有量纲的量。

相关系数是一种与量纲无关的,描述随机变量之间的相关性的数字特征。

若随机变量XY的期望与方差都存在,称:

\rho=\frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}}= \frac{b\sigma^2}{\sigma |b| \sigma}=\begin{cases} 1, & b>0 \\ -1, & b<0 \end{cases}

为XY的相关系数。

 

 (1)|\rho_{XY}| \le 1

(2)定理: | ρXY | = 1的充要条件是,存在常数a,b,使得\rho \left\{ Y=a+bX \right\}=1

  相关系数ρXY取值在-1到1之问,ρXY = 0时,

  称X,Y不相关; | ρXY | = 1时,称X,Y完全相关,此时,X,Y之间具有线性函数关系; | ρXY | < 1时,X的变动引起Y的部分变动,ρXY的绝对值越大,X的变动引起Y的变动就越大, | ρXY | > 0.8时称为高度相关,当\rho^2_{XY}<0.09,即 | ρXY | < 0.3时,称为低度相关,其他为中度相关。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值