有时候我们研究的问题只有一种数据,例如人的身高;但是,还有另外一些问题需要研究多种数据,例如身高和体重之间的关系(图2-86)。当我们研究两种或者两种以上的数据之间有什么关系的时候,就要用到相关分析。如果两种数据之间有关系,叫作有相关关系;如果两种数据之间没有关系,叫作没有相关关系。
相关分析的作用有以下三点:
(1)在研究两种或者两种以上数据之间有什么关系,或者某个事情受到其他因素影响的问题时,可以使用相关分析(图2-88)。
(2)在解决问题的过程中,相关分析可以帮助我们扩大思路,将视野从一种数据扩大到多种数据(图2-89)。
(3)相关分析通俗易懂(图2-90)。这在实际工作中很重要,因为数据分析的结果需要得到其他人的理解和认可,所以要方便大家沟通。很多分析方法看上去很高端,但是没有相关知识的人不容易理解。而相关分析通俗易懂,你不需要向对方解释什么是“相关”的含义及分析结果的意义,对方也能够理解。
使用相关分析的注意事项:
相关关系不等于因果关系。在使用的时候注意这一点,可以提高分析的质量。什么是因果关系?因果关系的意思是A的发生会导致B,B的发生是因为A。例如在控制其他因素的前提下,暴饮暴食和肥胖,就是一种因果关系,吃太多会导致肥胖,之所以肥胖是因为吃太多。但是,如果A和B有正相关关系,A提升B也提升,我们却不能由此简单得出结论:B提升的原因就是A。实际上,要么是存在某个第三方因素C影响了B,要么就是“纯属巧合”。
如何判断两种数据之间是相关关系,还是因果关系呢?可以使用“单变量控制法”,也就是控制其他因素不变,只改变其中一个因素,然后观察这个因素对实验结果的影响。例如,每天早上公鸡一打鸣,太阳就会升起。如果我们把公鸡杀掉,太阳还是会升起,完全不受公鸡的影响。所以,“太阳升起”和“公鸡打鸣”是相关关系,而不是因果关系。