相关性分析就是通过定量指标描述变量之间的强弱、直接或间接的联系。
常见相关性指标
- Pearson相关系数(积差相关系数)
- Spearman等级相关系数
- Kendall’s Tau相关系数
- 偏相关
Pearson相关系数(积差相关系数)
Pearson相关系数是用于表示相关性大小的最常用指标,数值介于-1~1之间,越接近0相关性越低,越接近-1或1相关性越高。正负号表明相关方向,正号为正相关、负号为负相关。
适用条件
- 两个正态分布的连续变量
Spearman等级相关系数
又称为秩相关系数,利用两变量的秩次大小来进行分析,属于非参数统计方法。
适用条件
- 适用于不满足Pearson相关系数正态分布要求的连续变量。
- 也可以用于有序分类变量的之间的相关性测量。
Kendall’s Tau相关系数
Kendall’s Tau相关系数是一种非参数检验。
适用条件
- 适用于两个有序分类变量。
偏相关
当要进行相关性分析的两个变量其取值受到其他变量影响时,可以利用偏相关分析对其他变量进行控制,在控制其他变量基础之上进行这两个变量之间相关性分析。
适用条件
- 考虑第三方影响的两个变量之