线性相关评价方法、python.DataFrame.corr函数

这篇博客介绍了pandas.DataFrame.corr函数的使用,包括Pearson、Kendall和Spearman三种相关系数的计算方法。Pearson系数衡量线性关系,适用于双变量正态分布数据;Spearman系数用于非正态分布或等级数据;Kendall系数关注等级变量的相关程度。每个系数都有其特定的计算公式和适用范围。
摘要由CSDN通过智能技术生成

1、pandas.DataFrame.corr

DataFrame.corr(method: {'pearson', 'kendall', 'spearman'})

相关方法:

pearson:标准相关系数

kendall:Kendall Tau相关系数

spearman:Spearman秩相关系数

解释:相关系数的取值范围为[-1,1],属于0.8-1:极强相关;属于0.6-0.8:强相关;属于0.4-0.6:中等程度相关;属于0.2-0.4:弱相关;0-0.2:极弱相关或无相关;

2、三种常见相关系数及适用范围

(1)pearson相关系数:度量两变量x和y之间的线性关系,样本协方差除以x的标准差与y的标准差的乘积

公式:​$$r_{x y}=\frac{s_{x y}}{s_{x} s_{y}}$$

其中, $$r_{x y}$$为样本相关系数;

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值