python统计各省大学数_新冠肺炎的致死率,全国各省排名,湖北排第三位

经过一个月的奋战,新冠肺炎的疫情,在湖北之外终于将到达拐点。当然现在绝不是松一口气的时候。继续严防死守,同时应对更加艰难的疫后重压,这条路还很漫长。

不过,在此病毒已经越过爆发期的时候,我们可以从一些统计数据,分析全国各省区的疫情差异。到底哪个省区的危险比较大,哪个省区的安全度更高,为何数据上有这些差距。这或许会为我们后期的战斗,以及针对未来可能重现的灾难,提供一些参考。

老巴并不是统计达人,也不是大数据专家,只能算一个数学爱好者。所以,老巴的统计非常简单。数据的来源,也就是官方每日更新的疫情报告。以2020年2月19日晚上19点的数据为基准。

这个数据,大家一定非常熟悉了。以省区(包括港澳台)为单位,分别统计每个省区的累计感染数和死亡数。

ac7b0d860fb7ba18694174b65db0113c.png

同时,我们注意的风险高低,不能只看绝对感染数和死亡数的大小,还得看整个人口基数。比如广东省确诊人数是1131人,海南省只有163人。但这绝不能说广东疫情比海南严重。因为广东的人口是海南的10多倍。所以,在广东感染上的比率,其实是比海南要低的。

所以,老巴在上述官方数据的基础上,引入第三个参数:各省区人口数。老巴这个数据就是从网上扒拉的,据说是2019年初的数据,未必准确,但应该不会有太大的出入。

以这三个基础参数两两计算,我们可以得出三个复合参数:

第一,用确诊数除以总人数,得到“每万人确诊数”。这个参数说明肺炎病毒在全省区内人口中的感染比例。

第二,用死亡数除以总人数,得到“每百万人死亡数”。这个参数说明肺炎病毒在全省区内人口造成的死亡率。

第三,用死亡人数除以确诊人数,得到“确诊致死率”,即确诊病人中有多高比例会死亡。

根据这三个复合参数,而不是两个基础参数来排列,评价各省区的安危程度。

此外,湖北省作为疫情爆发区,其无论确诊人数还是死亡人数,都占去了全国的一大半,可以说大大拉高了全国的平均值。因此从纵向上,除了以省区为单位统计外,还统计一个“全国数据”和一个“全国除湖北外数据”(简称外地数据),作为参考比较。

这样就得到下面这张表格。

53a3250514e49a821a86bd0766439bcc.png

接下来,老巴为您逐步分析。

第一:湖北、全国和全国除湖北的数据(外地数据)。

湖北的每万人确诊10.45人,即超过千分之一。每百万人死亡32.55人,即接近三万分之一。致死率3.11%,即接近三十分之一。

相对而言,全国的每万人确诊为0.52人,刚过二万分之一。每百万人死亡1.42人,约70万分之一。致死率2.7%,即超过四十分之一。

而全国除湖北之外的地区,每万人确诊0.09人,不到十万分之一。每百万人死亡0.06人,不到一千六百万分之一。致死率0.7%,约140分之一。

可见,无论哪一个数据,都是湖北远远凌驾全国之上。湖北的致病率是其他省区的100多倍,百万人死亡率是全国的500倍,致死率是全国的4倍多。

第二:其他各省区的每万人确诊数排列(湖北10.45;全国0.52;全国除湖北0.09)

浙江0.207,江西0.202,重庆0.182,北京0.181,海南0.176,澳门0.159,安徽0.158,湖南0.147,上海0.138,河南0.132,黑龙江0.124,广东0.119,宁夏0.104

(外地均值分割线)

香港0.085,天津0.082,江苏0.079,福建0.075,陕西0.063,四川0.062,山东0.054,广西0.050,贵州0.041,河北0.041,云南0.036,陕西0.035,甘肃0.035,吉林0.033,新疆0.031,青海0.030,内蒙0.030,辽宁0.028,台湾0.010,西藏0.003

753cfca85e86c780e4a912192e19f5b0.png

由数据可以看出,每个省区的万人确诊数,整体规律是发达地区(如浙江、北京、上海、广东等)确诊比例较高,欠发达地区确诊比例较低。这是因为发达地区可能会有不少湖北人打工,人口跨省流动大,且城市较多,人口密度较大。欠发达地区则与湖北之间人口流动较少。

整体人口密度大的地区(如北京、上海、河南)确诊比例较高,人口密度小的地区(如甘肃、新疆、青海、内蒙、西藏)确诊比率较低

当然,“确诊数”这本身是较为不靠谱的一个数字,因为受制于统计口径和统计方法。对于没有症状或轻症状的人,是可能被遗漏统计的。这一点,咱们后面再说。

从这里还可以看出,广东的确诊数虽然在全国仅次于湖北,但那是因为广东人口基数大。相反,感染比例上广东为每万人0.119,仅稍高于湖北之外的全国均值。而四川靠近湖北,感染比例却较低,应该得益于四川地方有效的防控措施。

第三,其他各省区的每百万人死亡数排列(湖北32.548,全国1.415,全国除湖北0.065)

海南0.4320,黑龙江0.3167,香港0.2692,河南0.1988,天津0.1927,北京0.1842,重庆0.1640,安徽 0.0959,上海0.0827,甘肃 0.0762

(外地均值分割)

湖南0.0583,贵州0.0559,河北0.0532,广东0.0448,台湾0.0422,广西0.0409,新疆0.0409,吉林 0.0368,四川 0.0361,山东 0.0300,辽宁 0.0229,江西 0.0216,云南 0.0208

浙江、澳门、宁夏、江苏、福建、陕西、山西、青海、内蒙、西藏为0。

52133c93da812ffc01502184e11b6c5d.png

死亡比例的分布趋势,比确诊比例更靠谱。因为确诊数字可能是统计失真(因为可能得病的没有症状或轻症状造成统计遗漏),而死亡数字虽然也存在统计误差,整体误判风险较小。所以,看死亡比例,其实比看确诊比例,能更好分析出这个省区的严重性来。

而湖北之外各省区的死亡比例分布,也与确诊比例有明显不同。例如广东的确诊比例是高于全国除湖北外均值的,而死亡比例却明显低于这个均值。更厉害的是浙江,确诊比例高达全国第一,而死亡数则为0。这实际上一方面反应浙江的诊断排查到位,另一方面反应浙江对患病者的治疗措施更得力,使得1000多例病患中无一例死亡。而这个,恰好又与浙江的经济发达,医疗条件好,市政措施得力等有关。

第四,其他各省区的确诊致死率数排列(湖北3.11%,全国2.7%,全国除湖北0.7%)

台湾4.35%,香港 3.17%

黑龙江2.55%,海南2.45%,天津2.34%,甘肃2.20%,河南 1.51%,贵州1.37%,新疆1.32%,河北1.31%,吉林 1.11%,北京1.02%,重庆0.90%,辽宁0.83%,广西0.82%,

(外地均值分割)

安徽0.61%,上海0.60%,四川 0.58%,云南0.58%,山东0.55%,湖南0.40%,广东0.38%,江西0.11%

浙江、澳门、宁夏、江苏、福建、陕西、山西、青海、内蒙、西藏为0

5153565934b1eec2a973351186f6bd6c.png

确诊病人的致死率数据,有点让人跌破眼镜。台湾和香港居然比湖北还要高。当然,这和他们本身的致病基数较少有关。因为分母小,分数值一不小心就上去了。但香港的数值这么高,除了本身基数小,还有一种可能就是统计口径的失真,导致实际上存在众多潜在的病患未被记入分母。

最后,根据上述三个复合数值在表中的位置,我们可以将全国除湖北之外的省区,大致分为6类。

第一类,较危险地区。

即确诊比例、死亡比例和确诊致死率均高于外地均值的地区。往往确实疫情风险比较大。

包括重庆、北京、海南,河南,黑龙江

第二类,确诊较少的危险地区。

即确诊比例低于外地均值,但死亡比例和确诊致死率高于外地均值的地区。

包括香港,天津,甘肃

第三类,次危险地区。

即确诊比例和死亡比例高于外地均值,但确诊致死率低于外地均值的地区。这个数据说明该地区患病风险较大。

包括安徽,上海,

第四类,确诊较少的次危险地区。

即确诊比例和死亡比例均低于外地均值,但确诊致死率高于外地均值的地区。该地区患病之后的风险较高。

包括贵州,河北,台湾,广西,新疆,吉林,辽宁

第五类,确诊较多的安全区域。

即确诊比例较高,但死亡比例和致死率都较低。

包括浙江,江西,澳门,湖南,广东,宁夏

第六类,最安全区域。

即确诊比例、死亡比例和致死率都低的地区。

包括江苏、福建、陕西、山西、青海、内蒙、西藏、四川、云南、山东

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
92讲视频课+16大项目实战+课件源码  为什么学习据分析?       人工智能、大据时代有什么技能是可以运用在各种行业的?据分析就是。      从海量据中获得别人看不见的信息,创业者可以通过据分析来优化产品,营销人员可以通过据分析改进营销策略,产品经理可以通过据分析洞察用户习惯,金融从业者可以通过据分析规避投资风险,程序员可以通过据分析进一步挖掘出据价值,它和编程一样,本质上也是一个工具,通过据来对现实事物进行分析和识别的能力。不管你从事什么行业,掌握了据分析能力,往往在其岗位上更有竞争力。   本课程共包含五大模块: 一、先导篇: 通过分析据分析师的一天,让学员了解全面了解成为一个据分析师的所有必修功法,对据分析师不在迷惑。  二、基础篇: 围绕Python基础语法介绍、据预处理、据可视化以及据分析与挖掘......这些核心技能模块展开,帮助你快速而全面的掌握和了解成为一个据分析师的所有必修功法。 三、据采集篇: 通过网络爬虫实战解决据分析的必经之路:据从何来的问题,讲解常见的爬虫套路并利用三大实战帮助学员扎实据采集能力,避免没有据可分析的尴尬。  四、分析工具篇: 讲解据分析避不开的科学计算库Numpy、据分析工具Pandas及常见可视化工具Matplotlib。  五、算法篇: 算法是据分析的精华,课程精选10大算法,包括分类、聚类、预测3大类型,每个算法都从原理和案例两个角度学习,让你不仅能用起来,了解原理,还能知道为什么这么做。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值