相关分析,是常见的统计分析方法,它旨在研究两个或多个变量之间是否存在某种依存变化关系。你知道如何判断变量之间的相关性?如何在JMP中实现相关分析?今天的文章我们就来一起探索相关分析。
为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第17期。
相关分析通常关注两个维度:相关大小和相关方向。相关大小用相关系数r的大小表示,r越大说明相关性越强。相关方向通过r的正负值来反映,正值表示正相关,负值表示负相关。
关于相关系数的强弱并无统一的划分界限,但也有一些约定俗成的看法是,|r|大于0.7认为相关性强;0.5-0.7为中等强度相关;0.3-0.5为弱相关。也有其它划分方式,如大于0.8认为相关性强,等等不一而足。尽管有这些所谓标准,但不同领域的各有侧重,例如社会学现象能达到0.7的非常少,而医学实验室指标达到0.9以上的比比皆是。所以这些所谓的划分标准,大家稍微了解一下即可,不能太死板教条。
通常意义上说的相关系数是指Pearson相关系数(有时也包括Spearman相关系数),它是用来描述线性相关的。但实际中除了线性相关外,还存在大量的非线性相关关系,例如对数相关、抛物线相关等。
因此,在进行相关分析前,最好先绘制散点图,粗略探索数据的相关性&#x