辛普森悖论:当数据讲述两个不同的故事时!
一、介绍
你有没有被统计数据愚弄过?辛普森悖论表明,分析总体数据可能会掩盖重要趋势。我们可以通过分解信息来发现逆转或消除关系的隐藏因素。这份简短的指南将使您避免被汇总数据误导,并确保您看到全貌。
二、辛普森悖论的叙述
2.1 概述
辛普森悖论(Simpson’s Paradox)强调了聚合数据如何掩盖了在各个亚组中看到的趋势。
著名的例子包括加州大学伯克利分校的招生案,其中性别偏见出现了,但在更深入的分析后消失了。
COVID-19 数据显示,在考虑年龄和健康因素之前,接种疫苗的人死亡率更高。
这种悖论通常是由于数据分析中的混淆变量和省略的变量偏差引起的。为避免辛普森悖论,请始终在多个层面分析数据并考虑潜在的隐藏因素。
目录
2.2 什么是辛普森悖论?
辛普森悖论是一种统计现象。当子组的趋势在组合数据中消失或逆转时