最近老爸开心地和我分享新闻,说甘肃太厉害了,治愈率比上海高10个百分点,我说不会吧,这来自啥洋葱新闻,后来一看,老人家是对的!
我懵逼了,感觉和直觉不符合,两个省的轻重症比例不一样啊,以2.26日为例,甘肃重症3例(总病例91例,重症占3%),上海危重症+重症有12例(总病例(总病例61例,危重症+重症占20%)。如果混淆轻重症,笼统统计治愈率,怕是会陷入辛普森悖论吧(总体规律和部分规律不一样)。
那接下来我们举例子来说明一下为什么总治愈率高的地方,可能实际治愈率并不高。假设有城市A、B,我们来看下统计数据,直观判断一下哪个治愈情况更好:
可以看到,不管轻症/(危)重症,A市治愈率都很高,尤其是(危)重症治愈率远远高于B市。
BUT,一旦将轻重症混合在一起,结论就相反了。。。看下图:
下图B市的治愈率比A市高4个百分点,难道我们的结论要改成B市治愈状况更好吗??并不是的,B市的劣势在重症治疗上面,但是它本来就没几例(危)重症啊,所以这个短板很容易就被弥补了,而A市危重症病例的基数很大,即使治愈率高,但是未被治愈的人数也会很大。**
所以如果笼统统计,B市比A市治愈率高,这个结论并不确切。**
——————————**——————————————————————
其实,不仅疾病统计,在数据分析中,辛普森悖论经常会出现,请移步“人人都是产品经理”看其在产品运营中的应用http://www.woshipm.com/data-analysis/1061642.html。
好啦,这期就这样,再见啦👋
链接:
http://www.shanghai.gov.cn/nw2/nw2314/nw32419/nw48516/nw48546/u21aw1428586.html