协方差到相关系数

首先要明确:协方差、相关系数本质上是一个东西,目的都是描述两个随机变量之间具有什么样的关系。

事物之间的关系

事物之间的关系有两种:有关系(正相关、负相关)、没关系。买房人数和房价是有关系的,买房人数越多则房价越高(正相关);而中彩票与求神拜佛之间,我觉得是没关系的。

一、 协方差

1)你变大,同时我也变大,说明两个变量是同向变化的,这时协方差就是正的。2)你变大,同时我变小,说明两个变量是反向变化的,这时协方差就是负的。3)从数值来看,协方差的数值越大,两个变量(正、负相关)程度也就越大。反之亦然。协方差公式如下:Cov(X,Y)=E[(X-\mu _{x})(Y-\mu _{y})]

X,Y围绕均值附近,根据协方差公式来判断符号正负,以下图1 同向变化,乘积为正,故为正相关;图2为负相关。

        

以上两种情况一眼可以看出正负相关性,这里还有一些就很难一眼看出,需要通过计算来判断。这时,很可能某一时刻X-\mu _{x}的值与Y-\mu _{y}的值乘积为正,另外一个时刻X-\mu _{x}的值与Y-\mu _{y}的值乘积为负。将每一时刻X-\mu _{x}Y-\mu _{y}的乘积加在一起,其中的正负项就会抵消掉,最后求平均得出的值就是协方差,通过协方差的数值大小,就可以判断这两个变量同向或反向的程度了。总结一下,如果协方差为正,说明X,Y同向变化,协方差越大说明同向程度越高;如果协方差为负,说明X,Y反向运动,协方差越小说明反向程度越高。(注意:方差为正,是整体变化为正相关,不必每时每刻都正相关。)

         

二、相关系数

用X、Y的协方差除以X的标准差和Y的标准差的乘积,就得到相关系数,公式表示如下:

   相关系数值区间[-1,1],也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。由于它是标准化后的协方差,因此更重要的特性来了:它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时(归一化后)的相似程度。

preview 

很容易就可以看出以上两种情况X,Y都是同向变化的,而这个“同向变化”,有个非常显著特征:X、Y同向变化的过程,具有极高的相似度!无论第一还是第二种情况下,都是:t1时刻X、Y都大于均值,t2时刻X、Y都变小且小于均值,t3时刻X、Y继续变小且小于均值,t4时刻X、Y变大但仍小于均值,t5时刻X、Y变大且大于均值……

第一种情况方差:[(100-0)\times (70-0) +( -100-0)\times ( -70-0)+(-200-0)\times (-200-0)...]\div 7\approx 15428.57  

第二种情况方差:[(0.01-0)\times (70-0) +( -0.01-0)\times ( -70-0)+(-0.02-0)\times (-200-0)...]\div 7\approx 1.542857

协方差相差出了一万倍,只能从两个协方差都是正数判断出两种情况下X、Y都是同向变化,但是,一点也看不出两种情况下X、Y的变化都具有相似性这一特点。为什么?因为以上两种情况下,在X、Y两个变量同向变化时,X变化的幅度不同,这样,两种情况的协方差更多的被变量的变化幅度所影响了。于是我们从相关系数来观察两种情况的差别:

第一种情况的相关系数计算:

\sigma _{X} =\sqrt{E((X-\mu _{x})^{2} )} =\sqrt{[(100-0)^{2}+ (-100-0)^{2}...]\div 7} \approx 130.9307

\sigma _{Y} =\sqrt{E((Y-\mu _{y})^{2} )} =\sqrt{[(70-0)^{2}+ (-70-0)^{2}...]\div 7} \approx 119.2836

于是相关系数得到:\rho =15428.57\div (130.9307\times 119.2836)\approx 0.9879

同理,第二种情况的相关系数计算:

\sigma _{X} =\sqrt{E((X-\mu _{x})^{2} )} =\sqrt{[(0.01-0)^{2}+ (-0.01-0)^{2}...]\div 7} \approx 0.01309307

\sigma _{Y} =\sqrt{E((Y-\mu _{y})^{2} )} =\sqrt{[(70-0)^{2}+ (-70-0)^{2}...]\div 7}\approx 119.2836

于是相关系数得到:\rho =1.542857\div (0.01309307\times 119.2836)\approx 0.9879

结论:两种情况的相关系数相等,故两者具有一致的相关性。

写在最后:对于更加严谨深刻的学习协方差和相关系数,可从欧式距离和余弦距离进行

 

 

 

 

 

  • 5
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值