冰淇淋销量与溺亡人数之间,存在时序滞后的相关关系。能说明是冰淇淋销量的上升导致了溺亡数量的上升吗?
因果和相关性要时刻区分开
不是冰淇淋影响了溺水
还有其它未统计的隐藏因素导致二者共同的变化:可能是温度,也可能是月份。
另一个例子在:一文搞定高通量数据整合分析中批次效应的鉴定和处理,时刻注意潜在隐藏因素的影响。
这个图是不是很熟悉?
冰淇淋销量与溺亡人数之间,存在时序滞后的相关关系。能说明是冰淇淋销量的上升导致了溺亡数量的上升吗?
因果和相关性要时刻区分开
不是冰淇淋影响了溺水
还有其它未统计的隐藏因素导致二者共同的变化:可能是温度,也可能是月份。
另一个例子在:一文搞定高通量数据整合分析中批次效应的鉴定和处理,时刻注意潜在隐藏因素的影响。
这个图是不是很熟悉?