中国各城市首轮感染高峰期预测!(最新更新版)

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇

c3f34ca65624659acef4af0a84db5011.jpeg

作者:chenqin@知乎,经济学研究者

这两天,上海一位数据工程师(花名:chenqin),结合百度、头条、谷歌数据中台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数,通过算法预测计算出一组各大城市感染高峰期、与疫情结束日期。

就目前疫情比较严重的城市看,建议还没有到达感染高峰城市的网友,早点做好应急准备,因为我们面对的不仅是阳了的问题。

以下为正文:

近日,我对中国台湾地区、中国香港特别行政区和日本的感染情况与 “发烧” 搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:

1. 将 Google 搜索指数分为疫情期间和非疫情期间,非疫情期间的发烧指数平均数为

非疫情

, 将疫情期间的搜索指数做以下处理后加总,计算一个数值

疫情非疫情非疫情

其中 S 的含义是这样的:如果发烧的搜索是发烧人口的一个相对稳定的比例,且在非疫情期间发烧人口是总人口的相对稳定的比例,那么 S 就正比于疫情感染的人口占总人口的比例,我们把它叫做 “超额发烧搜索指数累计面积

2. 下图列出了台湾地区、香港特别行政区以及日本的 “超额发烧搜索指数累计面积”,即下图橙色面积、蓝色面积和灰色面积。

f5ceda4b596eedee4c76f3dc5371b190.jpeg

我们发现在这三个地区,当疫情达到顶峰时,这个 “超额发烧搜索指数累计面积” 的数值全部刚好达到 80。这两个地区第一波疫情结束时,香港特别行政区的面积达到了 160,台湾地区的面积达到了 200,日本的最终面积是 250。

3. 如果用百度搜索指数做类似的研究会有什么效果呢?我使用了本轮疫情进入群体感染最快、最早的石家庄、邢台和保定做了计算:

2a91e8cf44d1ce5ca0317457b07a69a3.jpeg

可以算出,从疫情开始后计算,石家庄的 “超额发烧搜索指数累计面积” 已经达到了 76,邢台已经达到了 67,保定也达到了 71。由此来看,百度搜索指数和 Google 指数分别算出的 “超额发烧搜索指数累计面积”,至少是在一个差不多的数量级上。

4. 考虑到保定、石家庄、邢台等地的发烧指数仍然在上升,以及百度搜索指数和 Google 指数的差异,我们比较保守地将 100 作为疫情达峰时的 “超额发烧搜索指数累计面积”,将 250 作为第一轮疫情结束时的 “超额发烧搜索指数累计面积”。那么我们通过每个城市的搜索指数累计增长,累计速度,就可以算出现在每一个有疫情的城市疫情达峰的时间,以及疫情结束的时间。

这是计算的结果,列出了所有能在明年春节前达峰的城市以及这些城市在达峰前已经感染的人口比例(截止至 12 月 20 日)。

3a61bdd9c3655729cd83e8d91a150901.jpeg

2022 年 12 月 12 日更新:

f8ebc934229d2d328222312616a7f9aa.jpeg

疫情分城市达峰时间表主要有三个改动,为了使得算法尽量准确:

第一是我将算法中过峰的“超额发烧搜索累计面积”修正回了80。

之前的几张表格中,保守起见,这个数值我使用了100,他会使一些城市过峰偏慢。但从这几天的数据看,石家庄、保定等地的累计超额倍数超过80的同时搜索指数也已经过峰,这说明中国内地城市居民,在非疫情-疫情的变化中,搜索行为的变化上和香港特别行政区、台湾地区的居民在同样时期的变化是非常类似的。因此一些城市的过峰时间会在表格中有所提前。

第二是加入了两个“进度条”,代表在城市在走向疫情顶峰和疫情结束的路程中感染了多少人。

“达峰进度条”说明的是在疫情达到日增顶峰前已经感染了多少人,这是城市疫情逐渐加剧,院感增加,医疗资源逐渐挤兑的一段日子,数字达到100时日增感染者就达到了顶峰。

而“结束进度条”说明的是在疫情过峰后,在这一波疫情结束前已经感染了多少人,这段时间的疫情虽然整体缓解,但感染还是会继续增加,并且大部分死亡会出现在这个阶段。在数字达到100时,城市的这一波疫情就基本结束了。

第三是加入了巨量算数指标修正了一些城市,加入了一些之前数据不足的城市,因此城市数量大幅度增加,一些城市的百度指数很低,但是抖音安装率很高,因此巨量算术的数据能够起到作用。

当然数据增加的更大原因是因为许多城市疫情正在逐步蔓延,因此进入了搜索指数的监测中。我常常收到私信和评论询问“我住在xx,但xx城市在哪里我在表格里面怎么看不到”,我想说,珍稀这样的时光吧,不出意外的话马上你就可以天天看到你住的城市了。


疫情达峰时间的推算,原本只是搜索指数的一次尝试,初衷是觉得有趣,但无心插柳,竟然能帮助许多人缓解焦虑。焦虑来自哪里?来自未知。既然和疫情共存了,那么不怕他不来,肯定得来,就怕它在计划外乱来。那么有一个数据,虽然简陋,但也比没有数据好,至少大致上是和真实趋势吻合的。

2022年12月13日:

4c8959a86f77a43af2aff9d762bd2900.jpeg

2022年12月14日:

76a434577bb8d56cb84b418fa10588ae.jpeg

2022年12月15日:

5c0f3176d8c2b4d97aeace918983721c.jpeg

2022年12月16日:

这也是该模型最后一次大幅度修改,数据相对稳定。

e195c710f101dd15d9b5f28b34edcbff.jpeg

2022年12月17日:

e2a1af746f217866a18cb053b513f04a.jpeg

2022年12月18日:

6b5fdec7229c5bc78051dcb9db0185ae.jpeg

12月19日更新:

许多有心人都能发现,今天的百度与巨量指数的“发烧”搜索出现了严重的数据污染。因此花了一些时间,用其他关键词做了一定修正。

a12be0e0c7f9894a33fdbb46c9cc9d95.jpeg

12月20日:

b3b806c13e2755e82219aeea3a7d727c.jpeg

注:因数据不足,图片大小限制,因此不得不去掉人口在50万以下的城市,以上仅供参考。

-End-

最近有一些小伙伴,让我帮忙找一些 面试题 资料,于是我翻遍了收藏的 5T 资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

3b6d1a90516162e7b1fe612773a25129.png

点击👆卡片,关注后回复【面试题】即可获取

在看点这里4de3f6fb79d33b94e0bf198066e19eec.gif好文分享给更多人↓↓

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值