数据预处理之数据相关性分析

相关性分析:

        分析连续变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程成为相关分析

计算相关系数:

  1.Person 相关系数:

     要求连续变量的取值服从正态分布,一般用于分析连续性变量之间的关系

  2.Spearman 秩相关系数:

     一般用于分析不服从正态分布的变量、分类或等级变量之间的关联性

  3.判定系数:

     用来衡量回归方程对 y 的解释程度

 

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale="catering_sale.xls"
data=pd.read_excel(catering_sale,index_col=u'日期') #读取数据,指定日期列为索引列

data.corr()  #相关系数矩阵,即给出了两个物品之间的相关系数

data.corr()[u'A物品']  #只显示A物品与其他菜式的相关系数

data[u'A物品'].corr(data[u'B物品'])  #计算A物品与B物品的相关系数

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值