Python+pandas计算数据关联系数

本文介绍了如何使用pandas的DataFrame对象的corr()方法计算数据列之间的Pearson和Spearman相关系数,探讨了相关系数的含义,并提供了计算与第8列相关性的示例代码。
摘要由CSDN通过智能技术生成

本文主要演示pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数和spearman相关系数)。

perason描述的是两个变量之间的线性相关性,当相关系数等于1时,为正相关,x和y正好散落在直线上,并且变量y随着x的增加而增加,当相关系数等于-1时,为负相关,x和y很好的散落在直线上,变量y随着x的增大而减小,当相关系数为0时,两个变量之间互不相关。
(皮尔森相关系数百度介绍:https://baike.baidu.com/item/Pearson%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/6243913?fr=aladdin)

speraman则描述的是两个变量之间的单调性(斯皮尔曼相关系数百度:https://baike.baidu.com/item/spearman%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/7977847?fr=aladdin)

直接来干货:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from scipy import linalg
data1=pd.read_csv(r’data_new.csv’,header=None)
data1.head(5)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值