经过一个月的奋战,新冠肺炎的疫情,在湖北之外终于将到达拐点。当然现在绝不是松一口气的时候。继续严防死守,同时应对更加艰难的疫后重压,这条路还很漫长。
不过,在此病毒已经越过爆发期的时候,我们可以从一些统计数据,分析全国各省区的疫情差异。到底哪个省区的危险比较大,哪个省区的安全度更高,为何数据上有这些差距。这或许会为我们后期的战斗,以及针对未来可能重现的灾难,提供一些参考。
老巴并不是统计达人,也不是大数据专家,只能算一个数学爱好者。所以,老巴的统计非常简单。数据的来源,也就是官方每日更新的疫情报告。以2020年2月19日晚上19点的数据为基准。
这个数据,大家一定非常熟悉了。以省区(包括港澳台)为单位,分别统计每个省区的累计感染数和死亡数。
同时,我们注意的风险高低,不能只看绝对感染数和死亡数的大小,还得看整个人口基数。比如广东省确诊人数是1131人,海南省只有163人。但这绝不能说广东疫情比海南严重。因为广东的人口是海南的10多倍。所以,在广东感染上的比率,其实是比海南要低的。
所以,老巴在上述官方数据的基础上,引入第三个参数:各省区人口数。老巴这个数据就是从网上扒拉的,据说是2019年初的数据,未必准确,但应该不会有太大的出入。
以这三个基础参数两两计算,我们可以得出三个复合参数:
第一,用确诊数除以总人数,得到“每万人确诊数”。这个参数说明肺炎病毒在全省区内人口中的感染比例。
第二,用死亡数除以总人数,得到“每百万人死亡数”。这个参数说明肺炎病毒在全省区内人口造成的死亡率。
第三,用死亡人数除以确诊人数,得到“确诊致死率”,即确诊病人中有多高比例会死亡。
根据这三个复合参数,而不是两个基础参数来排列,评价各省区的安危程度。
此外,湖北省作为疫情爆发区,其无论确诊人数还是死亡人数,都占去了全国的一大半,可以说大大拉高了全国的平均值。因此从纵向上,除了以省区为单位统计外,还统计一个“全国数据”和一个“全国除湖北外数据”(简称外地数据),作为参考比较。
这样就得到下面这张表格。
接下来,老巴为您逐步分析。
第一:湖北、全国和全国除湖北的数据(外地数据)。
湖北的每万人确诊10.45人,即超过千分之一。每百万人死亡32.55人,即接近三万分之一。致死率3.11%,即接近三十分之一。
相对而言,全国的每万人确诊为0.52人,刚过二万分之一。每百万人死亡1.42人,约70万分之一。致死率2.7%,即超过四十分之一。
而全国除湖北之外的地区,每万人确诊0.09人,不到十万分之一。每百万人死亡0.06人,不到一千六百万分之一。致死率0.7%,约140分之一。
可见,无论哪一个数据,都是湖北远远凌驾全国之上。湖北的致病率是其他省区的100多倍,百万人死亡率是全国的500倍,致死率是全国的4倍多。
第二:其他各省区的每万人确诊数排列(湖北10.45;全国0.52;全国除湖北0.09)
浙江0.207,江西0.202,重庆0.182,北京0.181,海南0.176,澳门0.159,安徽0.158,湖南0.147,上海0.138,河南0.132,黑龙江0.124,广东0.119,宁夏0.104
(外地均值分割线)
香港0.085,天津0.082,江苏0.079,福建0.075,陕西0.063,四川0.062,山东0.054,广西0.050,贵州0.041,河北0.041,云南0.036,陕西0.035,甘肃0.035,吉林0.033,新疆0.031,青海0.030,内蒙0.030,辽宁0.028,台湾0.010,西藏0.003
由数据可以看出,每个省区的万人确诊数,整体规律是发达地区(如浙江、北京、上海、广东等)确诊比例较高,欠发达地区确诊比例较低。这是因为发达地区可能会有不少湖北人打工,人口跨省流动大,且城市较多,人口密度较大。欠发达地区则与湖北之间人口流动较少。
整体人口密度大的地区(如北京、上海、河南)确诊比例较高,人口密度小的地区(如甘肃、新疆、青海、内蒙、西藏)确诊比率较低
当然,“确诊数”这本身是较为不靠谱的一个数字,因为受制于统计口径和统计方法。对于没有症状或轻症状的人,是可能被遗漏统计的。这一点,咱们后面再说。
从这里还可以看出,广东的确诊数虽然在全国仅次于湖北,但那是因为广东人口基数大。相反,感染比例上广东为每万人0.119,仅稍高于湖北之外的全国均值。而四川靠近湖北,感染比例却较低,应该得益于四川地方有效的防控措施。
第三,其他各省区的每百万人死亡数排列(湖北32.548,全国1.415,全国除湖北0.065)
海南0.4320,黑龙江0.3167,香港0.2692,河南0.1988,天津0.1927,北京0.1842,重庆0.1640,安徽 0.0959,上海0.0827,甘肃 0.0762
(外地均值分割)
湖南0.0583,贵州0.0559,河北0.0532,广东0.0448,台湾0.0422,广西0.0409,新疆0.0409,吉林 0.0368,四川 0.0361,山东 0.0300,辽宁 0.0229,江西 0.0216,云南 0.0208
浙江、澳门、宁夏、江苏、福建、陕西、山西、青海、内蒙、西藏为0。
死亡比例的分布趋势,比确诊比例更靠谱。因为确诊数字可能是统计失真(因为可能得病的没有症状或轻症状造成统计遗漏),而死亡数字虽然也存在统计误差,整体误判风险较小。所以,看死亡比例,其实比看确诊比例,能更好分析出这个省区的严重性来。
而湖北之外各省区的死亡比例分布,也与确诊比例有明显不同。例如广东的确诊比例是高于全国除湖北外均值的,而死亡比例却明显低于这个均值。更厉害的是浙江,确诊比例高达全国第一,而死亡数则为0。这实际上一方面反应浙江的诊断排查到位,另一方面反应浙江对患病者的治疗措施更得力,使得1000多例病患中无一例死亡。而这个,恰好又与浙江的经济发达,医疗条件好,市政措施得力等有关。
第四,其他各省区的确诊致死率数排列(湖北3.11%,全国2.7%,全国除湖北0.7%)
台湾4.35%,香港 3.17%
黑龙江2.55%,海南2.45%,天津2.34%,甘肃2.20%,河南 1.51%,贵州1.37%,新疆1.32%,河北1.31%,吉林 1.11%,北京1.02%,重庆0.90%,辽宁0.83%,广西0.82%,
(外地均值分割)
安徽0.61%,上海0.60%,四川 0.58%,云南0.58%,山东0.55%,湖南0.40%,广东0.38%,江西0.11%
浙江、澳门、宁夏、江苏、福建、陕西、山西、青海、内蒙、西藏为0
确诊病人的致死率数据,有点让人跌破眼镜。台湾和香港居然比湖北还要高。当然,这和他们本身的致病基数较少有关。因为分母小,分数值一不小心就上去了。但香港的数值这么高,除了本身基数小,还有一种可能就是统计口径的失真,导致实际上存在众多潜在的病患未被记入分母。
最后,根据上述三个复合数值在表中的位置,我们可以将全国除湖北之外的省区,大致分为6类。
第一类,较危险地区。
即确诊比例、死亡比例和确诊致死率均高于外地均值的地区。往往确实疫情风险比较大。
包括重庆、北京、海南,河南,黑龙江
第二类,确诊较少的危险地区。
即确诊比例低于外地均值,但死亡比例和确诊致死率高于外地均值的地区。
包括香港,天津,甘肃
第三类,次危险地区。
即确诊比例和死亡比例高于外地均值,但确诊致死率低于外地均值的地区。这个数据说明该地区患病风险较大。
包括安徽,上海,
第四类,确诊较少的次危险地区。
即确诊比例和死亡比例均低于外地均值,但确诊致死率高于外地均值的地区。该地区患病之后的风险较高。
包括贵州,河北,台湾,广西,新疆,吉林,辽宁
第五类,确诊较多的安全区域。
即确诊比例较高,但死亡比例和致死率都较低。
包括浙江,江西,澳门,湖南,广东,宁夏
第六类,最安全区域。
即确诊比例、死亡比例和致死率都低的地区。
包括江苏、福建、陕西、山西、青海、内蒙、西藏、四川、云南、山东