![e126bee7212ee03789be974d7d8dbd78.gif](https://img-blog.csdnimg.cn/img_convert/e126bee7212ee03789be974d7d8dbd78.gif)
本篇文章介绍基于R语言的相关性分析、相关系数的显著性检验及可视化,该教程为个人笔记,大家也可参考学习,不足之处也欢迎大家批评指正!
相关性分析用于评估两个或多个变量之间的关联,能通过定量指标描述变量之间的强弱、直接或间接联系。相关系数是对变量之间的相关程度的定量描述,相关系数值介于-1~1之间,越接近0相关性越低,越接近-1或1相关性越高;正负号表明相关方向,正号为正相关、负号为负相关。当数据呈正态分布时,才可以使用相关性分析。可以使用Shapiro-Wilk test进行检查数据是否满足正态分布。
该案例中示例数据包含多样性(diversity)、生物量(biomass)、产量(yield)和种植密度(density)四个指标(单位请自动忽略,数据仅作为示例使用)。
一、常见的变量间相关系数1、Pearson相关系数:Pearson相关系数是用于表示相关性大小的最常用指标,适用于两个正态分布的连续变量。
2、Spearman等级相关系数:又称为秩相关系数,利用两变量的秩次大小来进行分析,属于非参数统计方法。适用于不满足Pearson相关系数正态分布要求的连续变量,也可以用于有序分类变量的之间的相关性测量。
3、Kendall's Tau相关系数:Ken