标题叫再说相关性分析,为什么叫再说呢?因为之前说过了呗,但是一个知识点你反复咀嚼的时候就是会有不同的感悟,因此这篇文章要再来说说相关性分析。
什么是相关性
百度百科给的解释是:两个变量的关联程度。
或者多个变量,或者变量与变量之间吧的关联程度,都可以,就是说A和B之间肯定存在着某种关系,确定的关系我们用函数就可以描述出来了,而这种不稳定、不确定、不精确变化的关系我们就称之为相关关系。
比如不久前的新闻,说深圳离婚都要排号了,然后我们发现哈,越是大城市,人们的离婚率就越高,这就反映了城市化水平和离婚率之间的一个相关关系。
这是生活中的例子,工作中也很常见啊,如果一个指标和另一个指标是一起变化的,说明它们是相关的,而如果是一个指标先变化从而导致了另一个指标的变化,说明它们是有因果性的,什么是因果性,请接着往下看。
相关和因果的区别
两个变量之间存在相关关系,并不意味着一个变量会影响另一个变量,也不意味着二者存在实际关系。
再深入理解一下,相关性是数学关系,而因果性是逻辑关系。
还是城市化水平和离婚率的例子,只能说明城市化的水平越高的同时,离婚率也增加了(相关),但不能说是因为城市化水平高,所以导致人们离婚(因果),因为这中间还有很多因素,城市化水平只是其中的一个。
在知乎上看到一个例子也可以来说一下,火灾现场,救护车的数量与死亡人数呈正相关,这可能确是实情,但我们不能说是因为派去的救护车多了导致死亡人数的增加ÿ