28、python计算多序列间相关系数、相关程度

线性相关:主要采用皮尔逊相关系数来度量连续变量之间的线性相关强度;

线性相关系数|r    相关程度

0<=|r|<0.3       低度相关

0.3<=|r|<0.8     中度相关

0.8<=|r|<1       高度相关


1 函数

相关分析函数:

DataFrame.corr()
Series.corr(other)

  说明:
如果由数据框调用corr方法,那么将会计算每个列两两之间的相似度

如果由序列调用corr方法,那么只是计算该序列与传入序列之间的相关度

  返回值:
  
dataFrame调用:返回DataFrame
Series调用:  返回一个数值型,大小为相关度

2  案例
import pandas

data=pandas.read_csv(
        'D:\\DATA\\pycase\\5.6\\data.csv'       
           )

# 进行两列之间的相关性分析

data['人口'].corr(data['文盲率'])

## 多列之间的相关度的计算方法
## 选择多列的方法

data[[
      '超市购物率','网上购物率','文盲率','人口'
      ]].corr()


 

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值