相关性分析:
分析连续变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程成为相关分析
计算相关系数:
1.Person 相关系数:
要求连续变量的取值服从正态分布,一般用于分析连续性变量之间的关系
2.Spearman 秩相关系数:
一般用于分析不服从正态分布的变量、分类或等级变量之间的关联性
3.判定系数:
用来衡量回归方程对 y 的解释程度
#-*- coding: utf-8 -*-
import pandas as pd
catering_sale="catering_sale.xls"
data=pd.read_excel(catering_sale,index_col=u'日期') #读取数据,指定日期列为索引列
data.corr() #相关系数矩阵,即给出了两个物品之间的相关系数
data.corr()[u'A物品'] #只显示A物品与其他菜式的相关系数
data[u'A物品'].corr(data[u'B物品']) #计算A物品与B物品的相关系数