Pandas模块的corr()函数用法

本文介绍了Pandas模块的corr()函数,用于计算相关系数矩阵。详细解析了皮尔森相关系数的计算过程,并通过实例展示了如何对DataFrame进行转置操作以适应相关系数计算。此外,还探讨了corrwith()函数的不同使用场景,包括与Series和DataFrame的配合使用。
摘要由CSDN通过智能技术生成

因为corr()函数的输出结果是一个相关系数矩阵,把矩阵的详细生成过程理出来对于理解业务有一定帮助。

一、相关系数分类

        皮尔森相关系数:度量线性相关性。

        斯皮尔曼相关系数: 度量变量关系,不一定是线性。

        肯德拉相关系数:度量非线性关系。用于排名数据。

        皮尔森相关系数-corr函数的矩阵生成过程:

        数据集:【两列】

data = {

        'X':[1,2,3,4,5],

        'Y':[5,4,3,2,1]

}

皮尔森相关系数的计算公式为:

r = Σ[(x - μx) * (y - μy)] / [√Σ(x - μx)² * Σ(y - μy)²]

【x、y为变量值,ux和uy是变量的均值】

计算均值(ux、uy):

μx = (1 + 2 + 3 + 4 + 5) / 5 = 15 / 5 = 3

μy = (5 + 4 + 3 + 2 + 1) / 5 = 15 / 5 = 3

代入公式:

r = [(1 - 3) * (5 - 3) + (2 - 3) * (4 - 3) + (3 - 3) * (3 - 3) + (4 - 3) * (2 - 3) + (5 - 3) * (1 - 3)] / [√Σ(x - μx)² * Σ(y - μy)²]

= [-4 -1 + 0 -1 -4] / [√(4 

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值