pandas计算相关系数
在二元变量的相关分析过程中比较常用的有Pearson相关系数、Spearman秩相关系数和判定系数
1. Pearson相关系数
一般用于分析两个连续性变量之间的关系。计算公式如下:
2. Spearman秩相关系数
Pearson线性相关系数要求连续变量的取值分布服从正态分布。
不服从正态分布的变量、分类或等级变量之间的关联性可以采用Spearman秩相关系数,也称等级相关系数来描述。
3. 判定系数
判定系数是相关系数的平方,用r2表示;用来衡量回归方程对y的解释程度。
例子
data.corr() #计算任意两款菜式之间的相关系数
data.corr()['百合酱蒸凤爪'] #显示百合酱蒸凤爪与其他菜式的相关系数
data['百合酱蒸凤爪'].corr( data['翡翠蒸香茜饺']) #计算两个菜品之间的相关系数