皮尔森相关系数

最新推荐文章于 2020-02-23 14:56:48 发布

xiaopihaierletian

最新推荐文章于 2020-02-23 14:56:48 发布

阅读量2.2k

点赞数

文章标签：数学天地

本文链接：https://blog.csdn.net/xiaopihaierletian/article/details/53019127

版权

PearsonCorrelation

两个变量之间的相关系数越高，从一个变量去预测另一个变量的精确度就越高，这是因为相关系数越高，就意味着这两个变量的共变部分越多，所以从其中一个变量的变化就可越多地获知另一个变量的变化。如果两个变量之间的相关系数为1或-1，那么你完全可由变量X去获知变量Y的值。

      相关系数：考察两个事物（在数据里我们称之为变量）之间的相关程度。
      如果有两个变量：X、Y，最终计算出的相关系数的含义可以有如下理解：
      (1)、当相关系数为0时，X和Y两变量无关系。
      (2)、当X的值增大（减小），Y值增大（减小），两个变量为正相关，相关系数在0.00与1.00之间。
      (3)、当X的值增大（减小），Y值减小（增大），两个变量为负相关，相关系数在-1.00与0.00之间。

      相关系数的绝对值越大，相关性越强，相关系数越接近于1或-1，相关度越强，相关系数越接近于0，相关度越弱。
通常情况下通过以下取值范围判断变量的相关强度：
相关系数     0.8-1.0     极强相关
                 0.6-0.8     强相关
                 0.4-0.6     中等程度相关
                 0.2-0.4     弱相关
                 0.0-0.2     极弱相关或无相关

皮尔逊相关也称为积差相关（或积矩相关）是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。
假设有两个变量X、Y，那么两变量间的皮尔逊相关系数可通过以下公式计算：

从公式一可以看出只要两个变量的标准差都不为0相关系数才有意义。

该系数不足：需要指出的是，相关系数有一个明显的缺点，即它接近于1的程度与数据组数n相关，这容易给人一种假象。因为，当n较小时，相关系数的波动较大，对有些样本相关系数的绝对值易接近于1；当n较大时，相关系数的绝对值容易偏小。特别是当n=2时，相关系数的绝对值总为1。因此在样本容量n较小时，我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。

xiaopihaierletian

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
皮尔森相关系数

PearsonCorrelation 两个变量之间的相关系数越高，从一个变量去预测另一个变量的精确度就越高，这是因为相关系数越高，就意味着这两个变量的共变部分越多，所以从其中一个变量的变化就可越多地获知另一个变量的变化。如果两个变量之间的相关系数为1或-1，那么你完全可由变量X去获知变量Y的值。相关系数：考察两个事物（在数据里我们称之为变量）之间的相关程度。
复制链接

扫一扫