2014年2月,智利在复活节岛发现了寨卡病毒感染的首位本土病例。2015年5月,巴西开始出现寨卡病毒感染疫情。截止2016年1月26日,有24个国家和地区有疫情报道,其中22个在美洲,目前欧洲多国也有报道,有蔓延全球之势。新加坡是一个国际旅客旅行枢纽,也是一个热带城市,所以没有能够幸免,目前也受到影响。
我希望能够通过收集到的公共信息和使用计算机分析来预测寨卡病毒未来在新加坡的传播和发展情况。本文只是我玩预测的一个练习,对于结果不负任何责任。
首先,目前的认知来看,寨卡病毒通过伊蚊传播,因此,对于伊蚊生活习性,繁殖规律,飞行距离等信息的了解可以帮助我们建立寨卡病毒的传播路径。同时,需要了解新加坡的建筑结构,社区街道情况,新加坡本岛风向,人们生活出行等情况,修正病毒传播路径,最后还要考虑寨卡病毒自身的繁殖规律和传染病扩散,湮灭模型判断,寨卡病毒在新加坡最终是大规模扩散,还是趋于平稳,还是会在新加坡卫生防疫部门努力下逐渐缩小。
接下来,我们针对寨卡病毒传播路径进行建模 $$ F= f((x,y,z),t,n) (x,y,z)是地理坐标 t是时间 n是在t时间点,在(x,y,z)地理位置出现的被感染病人人数 $$ 这样是为了方便描述预测结果,在未来的时间点,在什么地方会有多少人可能被感染。
有了目标,我们需要明确一系列的因果关系,(x,y,z)的取值是和伊蚊的分布,繁殖,飞行相关,同时还和这个坐标上的人群分布相关,这两个相关在时间的结合,极大决定了被感染人数n。我们不知道伊蚊的数量和分布,也很难确定人群在时间上的分布,那么我们只能根据另外的信息来推断。这就是已经感染的人数,地点随着时间的推移的变化来帮助确定伊蚊的分布,这为我下一步根据伊蚊的繁殖和飞行规律推断未来伊蚊的分布提供帮助。同时,地图上面房屋密集程度,道路分布提供了人群分布。这都为最后综合分析病毒传播路径提供帮助。
让我们首先进入数据准备,下面是从新加坡国家环境署发布的从2016年8月7日发现第一例本地感染到2016年9月8日的数据,2016.8.27 - 2016.9.7这一周累计发现215例,2016.9.4 - 2016.9.8累计发现77例,2016年9月8日一天就发现9例。具体的发现地理位置如下:
通过已经有的感染数据,我们初步能够判断,下一批可能出现感染的区域在PAYA LEBAR。因为从ALJUNIED开始,扩散的方向是朝东北,感染TOA PAYOH和BISHAN,还有BEDOK。大概能够解释的理由是,人群更为集中的CBD没有感染报告说明伊蚊在CBD的分布比东北方向少,同时内陆水源比海洋更能够滋生伊蚊。我们不在这些不太准确的分析上花费太多时间,让我们对这个数据建模来推断伊蚊分布。
在进入感染报告地理信息分析之前,这里简单回顾一下伊蚊的特性。第一,连续飞行距离5000-6000米;第二,雌蚊饱吸一次血能产一次卵,一生可产卵六至八次,每次200-300粒,卵仔合适的条件1-2天孵化为幼虫,5-7天化蛹,1-2天蛹变成虫。雌蚊喜欢在低洼间歇性潮湿的地方产卵。因此伊蚊分布的一个重要影响因子,建筑物高矮,开阔和封闭,间歇性潮湿,单纯在地理位置上就可以描绘伊蚊分布,所以我会做两次叠加,第一次是纯粹根据地理情况(建筑物高矮,开阔和封闭,间歇性潮湿)和伊蚊5000-6000米飞行距离,产卵200-300数量,7-14天的成长周期来绘制;第二次是根据寨卡病毒感染报告来绘制。具体过程就不再这里描述,最后结果我会在明天的预测连载中给出。