corrcoef函数python_用Numpy计算Python中的Pearson相关系数

本文介绍了皮尔逊(Pearson)相关系数,其手动计算以及通过Pythonnumpy模块进行的计算。

皮尔逊相关系数测量变量之间的线性关联。它的值可以这样解释:

  • +1-完全正相关
  • +0.8-强正相关
  • +0.6-中等正相关
  • 0-无关联
  • -0.6-中度负相关
  • -0.8-强烈的负相关
  • -1-完全负相关

我们将说明相关系数如何随不同类型的关联而变化。在本文中,我们还将显示零关联并不总是意味着零关联。非线性相关变量的相关系数可能接近零。

皮尔逊相关系数是多少?

皮尔逊相关系数也称为皮尔逊积矩相关系数。它是两个随机变量XY之间线性关系的度量。在数学上,如果(σXY)是XY之间的协方差,并且(σX)是X的标准偏差,则皮尔逊相关系数 ρ可以由下式给出:

9e8bcdb5348336a09d1ae57d4f102543.png

由于协方差总是小于各个标准偏差的乘积,因此ρ的值在-1+1之间变化。从上面我们还可以看到,变量与自身的相关性为1:

40df4aa448450ac85ecd0f666326698c.png


在开始编写代码之前,让我们做一个简短的示例,看看如何计算该系数。

皮尔逊相关系数如何计算?

假设我们对随机变量XY有一些观察。如果您打算从头开始实施所有工作或进行一些手动计算,那么在给定XY时需要以下内容:

585d514c15b63c1285b7e53ad06b2736.png

让我们使用以上内容来计算相关性。我们将使用协方差和标准偏差的有偏估计。这不会影响正在计算的相关系数的值,因为观察值的数量在分子和分母中抵消了:

ec8d95b50d4ab24cc7e092d0410582bc.png

使用Numpy的Python中的Pearson相关系数

皮尔逊相关系数可以使用corrcoef()Numpy中的方法在Python中计算。

此函数的输入通常是一个矩阵,例如size mxn

  • 5
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值