如何通俗易懂地理解皮尔逊相关系数？

最新推荐文章于 2025-03-22 22:54:21 发布

置顶打工人小飞

最新推荐文章于 2025-03-22 22:54:21 发布

阅读量7.6w

点赞数 30

分类专栏：算法数理统计 & 数据挖掘 R语言 & MATLAB 文章标签：皮尔逊相关系数协方差数理统计与数据分析相关系数相关度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huangfei711/article/details/78456165

版权

算法同时被 3 个专栏收录

50 篇文章

订阅专栏

数理统计 & 数据挖掘

25 篇文章

订阅专栏

R语言 & MATLAB

7 篇文章

订阅专栏

要理解 Pearson 相关系数，首先要理解协方差（Covariance）。协方差表示两个变量 X，Y 间相互关系的数字特征，其计算公式为：

$COV(X,Y)=\frac{1}{n-1}\sum_1^n(X_i-\overline X)(Y_i-\overline Y)$

当 Y = X 时，即与方差相同。当变量 X，Y 的变化趋势一致时，如果某个 $X_i$ 大于 $\overline X$ ，相应的 $Y_i$ 也大于 $\overline Y$ ；如果某个 $X_i$ 小于 $\overline X$ ，相应的 $Y_i$ 也小于 $\overline Y$ ，那么 $C O V (X, Y)$ 就是正值，当变量 X，Y 的变化趋势相反时，那么 $C O V (X, Y)$ 就是负值。

Pearson 相关系数公式如下：

$COR(X,Y)=\frac{\sum_1^n(X_i-\overline X)(Y_i-\overline Y)}{\sqrt{\sum_1^n(X_i-\overline X)^2\sum_1^n(Y_i-\overline Y)^2}}$

由公式可知，Pearson 相关系数是用协方差除以两个变量的标准差得到的，虽然协方差能反映两个随机变量的相关程度（协方差大于0的时候表示两者正相关，小于0的时候表示两者负相关），但其数值上受量纲的影响很大，不能简单地从协方差的数值大小给出变量相关程度的判断。为了消除这种量纲的影响，于是就有了相关系数的概念。

当两个变量的方差都不为零时，相关系数才有意义，相关系数的取值范围为[-1,1]。《数据挖掘导论》中给了一个很形象的图来说明相关度大小与相关系数之间的联系：
这里写图片描述

由上图可以总结，当相关系数为1时，成为完全正相关；当相关系数为-1时，成为完全负相关；相关系数的绝对值越大，相关性越强；相关系数越接近于0，相关度越弱。

关于皮尔逊相关系数的编程计算，MATLAB 中提供了现有的函数：

cor = corr(Matrix,'type','Pearson')

Matrix 参数即为需要计算的矩阵。

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。