协方差与相关系数的区别和联系

最新推荐文章于 2023-11-17 16:59:14 发布

跌跌撞撞进大坑

最新推荐文章于 2023-11-17 16:59:14 发布

阅读量1.4w

点赞数 4

分类专栏：数据分析文章标签：概率论矩阵线性代数数据分析

原文链接：https://www.zhihu.com/question/20852004

版权

数据分析专栏收录该内容

8 篇文章 1 订阅

订阅专栏

协方差和相关系数是衡量变量间关系强度的统计指标。协方差描述了两个变量误差的关联程度，其正负表示变量变化趋势的一致性或相反性。相关系数是协方差标准化后的形式，取值范围在-1到1之间，更直观地表达了变量间的线性相关性程度。相关系数为1表示完全正相关，-1表示完全负相关，0表示不相关。

摘要由CSDN通过智能技术生成

协方差与相关系数的区别和联系。

协方差：

公式： $E[(X-\mu_x)(Y-\mu_y)]$
协方差表示的是两个变量的总体的误差，这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致，也就是说如果其中一个大于自身的期望值，另外一个也大于自身的期望值，那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反，即其中一个大于自身的期望值，另外一个却小于自身的期望值，那么两个变量之间的协方差就是负值。
注：协方差大小，会受X,Y数据大小的影响，所以只能通过协方差的正负，来判断是正相关还是负相关，不能反映相关性的程度，所以相关系数就此诞生

相关系数：

公式： $\rho = \frac{Cov(X,Y)} {\rho_x \rho_y}$
公式翻译一下，就是XY的协方差除X的标准差和Y的标准差
所以，相关系数也可以看成协方差：一种剔除了两个变量量纲影响、标准化后的特殊协方差。是用来研究变量之间线性相关程度的量，取值范围是[-1,1]。
可参考
如何通俗易懂地解释「协方差」与「相关系数」的概念？
(https://www.zhihu.com/question/20852004)

跌跌撞撞进大坑

关注

4
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。