文章目录
线性相关
线性相关分析是描述两变量间直线相关,常用相关系数来描述。
根据数据的分布特性不同可以分为:皮尔逊相关系数(Pearson correlation coefficient )和斯皮尔曼相关系数(Spearman‘s rank correlation coefficient )
皮尔逊相关系数(stats.pearsonr)
适用条件:变量需要满足正态分布
计算表达式:
r = ∑ ( x − m x ) ( y − m y ) ∑ ( x − m x ) 2 ∑ ( y − m y ) 2 r=\frac{\sum\left(x-m_{x}\right)\left(y-m_{y}\right)}{\sqrt{\sum\left(x-m_{x}\right)^{2} \sum\left(y-m_{y}\right)^{2}}} r=∑(x−mx)2∑(y−my)2∑<