备战2024数学建模国赛(模型十二):逻辑回归 优秀案例(一)测控 SARS 流行趋势的优化模型

 专栏内容(赛前预售价99,比赛期间299): 2024数学建模国赛期间会发布思路、代码和优秀论文。(本专栏达不到国一的水平,适用于有一点点基础冲击省奖的同学,近两年有二十几个国二,但是达不到国一,普遍获得省奖,请勿盲目订阅)

python全套教程(一百篇博客):从新手到掌握使用python,可以对数学建模问题进行建模分析。

35套模型算法(优秀论文示例):马尔科夫模型、遗传算法、逻辑回归、逐步回归、蚁群算法、蒙特卡洛模拟、聚类模型、线性规划、粒子群算法、神经网络、相关系数、灰色预测、灰色关联分析、模糊综合评价、模拟退火、时间序列ARMA、方差分析支持向量机、插值、排队论、拟合模型、微分方程、层次分析法、小波分析、多元回归、图论floyd算法、图论Dijkstra模型、因子分析、动态规划、博弈论、决策树、典型相关分析、元胞自动机、主成分分析、TOPSIS法。

目录

摘要

一、问题的重述

二、合理假设及说明

三、符号的约定

四、模型的建立及评析

五、模型的特点

六、写给报刊的一篇短文

参考文献


摘要


        SARS(Severe Acute Respiratory Syndrome,严重急性呼吸道综合症, 俗称非典型肺炎)是21 世纪第一个在世界范围内传播的传染病。SARS 的爆发和蔓延给我国的经济发展和人民生活带来了很大影响。为了能定量的研究传染病的传播规律,人们建立了各类模型来预测、控制疾病的发生发展。
        在本题中给出了一个早期指数模型,我们把它称为模型 1,它在短期内有着计算参数简单等合理性与实用性,但却存在着用短期参数描述长期过程偏离实际的缺陷。基于此,我们考虑应该引进新的参数,建立更优的模型。
        由于 SARS 是新发传染病,人们对其的有效防治手段主要还是以预防为主的隔离和检疫,所以我们引进一个预防效果指数 k,来反映防控措施对 SARS 传播的影响;又由于 SARS 发病传染迅猛,为了描述这个特征,我们又引入了参数 r ,用来表示发病率。在假设所研究各地区人口为理想状态下的人群、对该病普遍易感等前提下,我们应用 Logistic 回归结合各地SARS 发病的疫情资料,用 Matlab 软件模拟,得到了一个更为优化的 Logistic SARS 模型,它给出了 SARS 流行趋势以及控制措施有效性的定量评估。由于参数 k 的引进,更符合实际情况也符合医学解释,并且能够预测 SARS 高峰期的到来时间,可能累计最大发病数,在测控和拟合实际上优于模型 1。同时,我们也通过 Matlab 语言对北京、山西等的计算值和实际数据进行了拟合,进而验证了这个模型的可靠性。
        当然,要建立一个最优模型还需要考虑更多因素,在考虑了传播途径及易感人群等因素后,也可以建立一个最优的 SEIRQ 模型。但这样考虑就需要大量的数据采集整理工作,但在实际中这是不易实现的。在对卫生部所采取部分措施的评析中,我们引入了小世界网络模型,对政府措施作出了定量评论,并用图形直观的表示出来。
        最后,我们分析了 Logistic SARS 模型的特点,并对其改进与应用做出了展望。

一、问题的重述


        SARS(Severe Acute Respiratory Syndrome,严重急性呼吸道综合症, 俗称非典型肺炎)是 21 世纪第一个在世界范围内传播的传染病。SARS 的爆发和蔓延给我国的经济发展和人民生活带来了很大影响;不过,我们也从中得到了许多重要的经验和教训,认识到定量地研究传染病的传播规律以及为预测和控制传染病蔓延创造条件的重要性。请对 SARS 的传播建立数学模型,具体要求如下:
(1)对附件 1 所提供的一个早期的模型,评价其合理性和实用性。
(2)建立自己的模型,说明此模型为什么优于附件 1 中的模型;特别地,要说明怎样才能建立一个真正能够预测以及能为预防和控制提供可靠、足够的信息的模型,这样做的困难在哪里?对于卫生部门所采取的措施做出评论,如:提前或延后 5 天采取严格的隔离措施,对疫情传播所造成的影响做出估计。附件 2 提供的数据供参考。
(3)给当地报刊写一篇通俗短文,说明建立传染病数学模型的重要性。

二、合理假设及说明


1.假设所研究的人口为理想状态下的人群,对该病普遍易感,每个发病病人单位时间内传染的易感者人数与未被感染的人数成正比,隔离或预防意识增强可在一定程度上影响病人单位时间内传染易感者人数的比率。
2.不考虑气温、气压等自然因素对 SARS 发病的影响。假设预测地区足够大,患病人数足够多。
4.在整个过程中不考虑由人口流动因素所造成的影响,也不考虑人口的自然出生和死亡。

三、符号的约定


四、模型的建立及评析


1.对模型 1 的评价
1.1 合理性
SARS 属于传染性流行病,在其发生发展的短期内,不会有人口的病死,而且,
病原体传染性很强,符合指数增长规律。所以,可以用模型 1 中的 N(t)=N0
(1+K)t 来描述,其中,K 为传染的平均概率。在考虑了传染期的限制后,该
模型又引入参数 L,用半模拟循环计算的方法,把到达 L 天的病例从可以引发直
接传染的基数中去掉。这样,使得该模型与实际发病初期的情况更为贴近。这一
点从题目的图 1、图 2 中直观可见,即在疫情发生初期该理论模型与实际情况拟
合较好。
1.2 实用性
通过建立这一模型可以定量的研究 SARS 初发期的疾病传播规律。通过这一规
律,依据参数 K、t,可以实现各地区的相关估计,预计 SARS 的发病高峰时间、
发病趋势等。这些信息对 SARS 防控具有指导意义。
1.3 局限性
该模型在传染病病发初期具有一定的合理性与实用性,但也存在一些不足。由于
SARS 的发病情况与诸多因素有关,而且事实上 SARS 的传播发展也需要一个较
长的周期,所以,用短期的模型来描述长期的病发过程是不够科学的。同时,在
原有模型中,K 值以病发高峰为界取各段的平均值作为传染概率,虽然简化了运算,但却加大了与实际的偏差。

2.建立自己的优化模型——Logistic SARS 模型
2.1 Logistic SARS 模型建立及其相对模型 1 的优越性
模型 1 只考虑了传染期限和传染率的问题,涉及的参数及考虑因素存在如上 1.3
所述的不足。而实际情况中,SARS 的发病规律并不为我们所熟知,目前也没有
治疗 SARS 有效方法,那么,以最原始的预防手段——隔离防治是最为有效的。
而且,经实践证明,隔离防治也确实在控制疾病的蔓延上起到了至关重要的作用。
于是我们引入了预防效果指数 k,用来反映疾病控制程度,它直接影响 SARS 的
流行趋势、发病时间、发病高峰出现时间及累计发病人数。又因为 SARS 发病传
染迅猛,为了描述这个特征,我们又引入了参数 r ,用来表示发病率 [1]。应用
Logistic 回归研究各地 SARS 发病的疫情资料,其流行趋势可用式(1)描述。

为了检测我们的模型是否能较好的反映各地区实际情况、具有普遍意义,我们又
以山西为例,对模型进行了验证。山西的疫情数据见附表 2,拟合(同上)结果
见图 2,参数估计值见表 2。

以上两个地区的模型拟合结果与实际非常接近。为了更进一步证明我们的
Logistic SARS 模型对疫区发病情况的拟合程度,我们引入决定系数 R2 作为检测
标准[2]。决定系数(R2)=1-残差平方和/总平方和。经过计算,两地区模型决定系
数 R2 均高于 0.99,预测值与真实值非常接近,拟合优度检验无显著性差异,说
明 Logistic 回归模型较好的描述了 SARS 的发病、流行情况,适合于 SARS 发病
拟合及流行特征研究。在模型中,r 表示发病增加速率,r 越大,疾病发展变化
越快,反映最初阶段发病人数增长速度快,高峰到来时间越早,持续时间越短;
r 越小,高峰到来时间越晚,持续时间越长。另外,从医学的角度来讲,对 SARS
采取相应的预防措施(如隔离、消毒)后,病例数有所下降,说明预防措施与该
疾病的发生发展密切相关。在我们所建立的 Logistic SARS 模型中引入了预防指
数 k,恰能更贴切的反映实际情况。而模型 1 并未对该因素予以考虑,这是它一
个欠完备的方面。
2.2 建立更优模型及困难所在
SARS 是流行性传染病,对于传统的流行病学模型通常假设:平均每个传染者在单
位时间内可与 Nβ 个种群的其他成员进行有效接触,其中 N 表示种群的总规模,
β 为传染性接触率。 由此假设所导致的传染率( Νβ Ι
N

= βSI )是易感者类 S
和感染者类 I 的规模的双线型函数。在对病愈后不具免疫力的传染病模型的研究
中,以前疾病的潜伏期都被忽视,假设易感者一旦被感染就立即变成了染病者,
即为 SIS[3]模型。但是对于 SARS 来说,在易感者被感染成为一个感染者之前,存
在一段时间的潜伏期,为了掌握具有潜伏期的传染病的传播规律,建立一个真正
能够预测以及能为预防和控制提供可靠、足够信息的模型,就应该进行全面考虑。SARS 的传播基本可以用下图[4]描述:

由于这种模型是建立在对发病后调查分析的基础上,所要算的系数的精确度与调
查的数据密切相关。但是对于数据的采集,通常只包括存活者,而对于那些已死
的病人,或对病程短,已经痊愈的病例以及对轻型不典型病例或隐伏型病例,我
们通常很难调查。此外,某些病人在患病后,可能会改变他原来的暴露状况,如
生活习惯的改变等。这样使病例对照研究或横断面研究所采用的病例类型,会与
队列研究或实验研究所获得的新病例不同。这就是现患病例——新病例偏倚。而
SARS 刚刚出现时,由于人们的茫然,没有引起足够的重视,致使其在很短的时
间内就扩散到全世界 32 个国家和地区。要统计较为精确的数据,因受人为、自
然等因素的影响,其难度可想而知。并且各个地区采取的措施不同,人口流动性
不定,所以,其预测也会受到限制。加之到目前为止,SARS 的传染源还未确定,
因此对于其他传播途径(动物等),无法做出较为准确的预知。
2.3 对卫生部所采取部分措施的评析
在 SARS 流行期间卫生部所采取的措施[5](见附录 3)主要有:卫生部门控制人
们之间的密切联系;控制传染期时间;引入反馈机制(如:政府强制措施);加
强疾病危险性的宣传教育;信息透明度等方面。为了能定量的评价这些措施的得
力性,我们拟用小世界网络模型[6]模拟卫生部门针对 SARS 病毒的传播所采取的
这些措施对疫情传播所造成的影响。
(1) 控制人口接触流动及隔离时间先后对 SARS 传播的影响
为了说明这两点,我们引入两个可调参数,在现实情况它们分别对应 W(表示
人们之间联系的密切程度)和 T(表示发现并隔离病源的速度)。可以预料 W 越
大,T 越延后,病毒就越容易传播;W 越小,T 越提前,病毒就越难传播。用小
世界模型模拟结果(如图 1、图 2 所示)也证实了这一点。其中,Ni 为当天仍患
病人数,Nt 为总患病人数。在图 1 中 T=2,左图 W=10,病毒传播自动衰减;右
图 W=20,病毒迅速传播。图 2 则反映了发现并隔离病源的速度相差 1 天的发病
变化趋势,如果拖后 5 天,其严重情况可想而知;若提前 5 天,则可使病情得到有效控制。

由此可见,不能及时发现控制病源和人们之间接触太多会非常有利于病毒的传
播。初期出现病毒的爆发正是由于这两个原因,要控制病毒的蔓延应该从这两个
方面入手。 所以,卫生部所采取的限制人口流动,以及早发现、早诊断、早报
告、早隔离、早治疗等措施都有效的控制了 W 和 T,从而使 SARS 的传播蔓延
得到了有效控制。
(2) 引入反馈机制后对 SARS 传播的影响
如果不引入其它的机制,那么病毒的传播就只有两种结果,要么自动衰减,要么
迅速蔓延,而实际情况中并非如此。在 SARS 传播过程中,人们的自觉性是一个
渐变的过程,会随着疫情的变化而变化,是一个反馈过程,引入这个反馈过程同
样可以减小 T 值和 W 值,从而达到抑制 SARS 的传播和扩散的效果(如图 3 所
示)。

由上图我们可以看到,引入了反馈机制使人们自我隔离后,病毒的传播得到有效
的控制。因此,卫生部采取的加大宣传提醒大家自觉地进行自我隔离、减少与别
人的接触以及改变不良的卫生习惯等措施,都有效的防止了 SARS 传播蔓延。
但是,实际中当人们发现当前患病人数 Ni<100 并且持续减小时,往往会放松警
惕。而此时,SARS 发病人数又会有所回升,这种趋势正如图 4 所示。

因此即使在疫情已经减轻的形势下,我们也一定不能麻痹大意,要贯彻好隔离制
度,提高警惕性和自觉性,这样才能根本地战胜 SARS。从这个意义上讲,在实
现了病例零增长后,卫生部仍坚持通报病例的统计工作以及坚决不放松警惕的措
施,都是十分正确的。
(3) 信息透明度对病毒传播的影响
实际情况中,不是所有人都能及时获得疫情信息从而开始自我隔离的,例如在北
京,直到 4 月 20 日公布了准确的患病人数后才开始大规模采取措施实施自我隔
离,因此这里就有一个信息透明度的问题。所以,我们也引入一个叫信息透明度
Ti 来表征这种情况,Ti 的意义是知道疫情情况从而会进行自我隔离的人占总人数
的比例。从图 5 我们可以看到透明度对病毒的传播也有重要的影响。

很明显,当透明度比较高时,疫情消失需要的时间比较少,高峰期患病的人数也比较少。
因此,卫生部每天通报疫情,让人们尽早地了解,从而做好预防措施,也是控制疫情的
有效方法。


五、模型的特点


5.1 模型的优点
首先,此模型引入了参数 k(预防指数)并运用 Logistic 阻滞增长模型来拟合,
比较符合实际情况以及相关医学解释,也即用医学与数学相结合的知识阐明了
SARS 发生发展规律,拟合结果与实际流行趋势贴近。
其次,用 t’和 Nmax 能够预测 SARS 高峰期的到来时间,可能累计最大发病数,这
样,人们就可以以此为参考,人为地来改变一些参数或控制一些相关因素,从而
达到预防疾病的传播与蔓延的效果,在现实中具有实用性。如,加强消毒,控制
人口流动均可以增大 k,从而可以使实际高峰期累计病例数降低。
第三,结果用图形拟合说明、验证,简洁直观。
5.2 模型的不足
尽管我们的预测结果已相当好,但仍有一些不足。当医疗条件变化时,治疗可能
成为最有效的手段,而且医源性感染的可能性也会大大降低,那么,k 的意义就
不像现在这样明显。而且,根据现有数据所拟合的模型都具有滞后性,原始数据
的精确度会影响到模型的效果。而下一代的 SARS 的模型或许应该更复杂,涉及
到更详细的空间和随机过程、作为病毒源头的动物、季节因素和多种传染模式,
那么,Logistic SARS 模型的应用就受到了限制。因此,它应该随条件的改变而
逐步改进。
5.3 模型的改进与推广
如果能够将传染源、接触率等因素化为参数考虑进去,可以进一步完善模型,使
之提供潜伏期、阈值、恢复期、最多感染人数、易感系数、平均感染人数等参数。
并且,若将功能基因组的分析工作进一步扩张到冠状病毒以外与 SARS 相关的病原体中,则对该模型的分析还可为疫苗和新型药物的研制提供理论支持。

六、写给报刊的一篇短文


多功用的传染病学的数学模型
谈起传染病学的数学模型,不少人都觉得很陌生,也会有这样的疑问:传染病学
与数学怎么会相关呢?实际上,生活中几乎所有的事情都与数学有着或多或少的
联系,用数学模型可以分析现象、解释问题、预测趋势、检验合理性等,它是人
们认识自然规律的一种不可或缺的方法,所以,用数学模型来研究传染病学是合
乎规律的。
其实,早在 1927 年人们就开始用数学模型的方法来研究传染病学问题了,并且
随着时间的推移,传染病学的数学模型已在人们的生产生活中发挥了很大作用。
这种模型的建立是在合理假设的前提下,选择了一些相关因素(例如,自然因素、
人为因素)作为参数,并通过它们之间的关系来描述传染病学的现象。通过这些
现象,可以反映出传染病的流行过程及一些规律特征。运用这些规律,人们可以
估计不同条件下的相关因素参数、预测疾病的发生发展趋势、设计疾病控制方案
及检验假设病因等。比方,通过预测高峰期的时间及发病人数,可以让人们提前
进入预警状态从而增进个人的防御意识及社会的整体防疫力,预算对突发事件的
物资投入以实现对经济的宏观调控和减少浪费,并使突发疫情对人们生产生活所
带来的不便最小化。
并且,借助数学模型来研究传染病,能使人们定量的认识传染病的发生发展,从而推动
和完善传染病理论以及数学理论的发展。同时,理论创新对理论教学也有着重要意义。
由此可见,建立一个合理的传染病学的数学模型是有着十分重大的现实意义的。
不过,人类与传染病的斗争是一个长期的过程,要建立一个合理的传染病学的数
学模型也将是一项繁重的工作,这是需要人们的共同努力以及相关学科共同的发
展。


参考文献


黄德生等,Logistic 回归模型拟和 SARS 发病及流行特征,中国公共卫生,第 19
卷第 6 期:71-72,2003
段广才,临床流行病学与统计学,郑州:郑州大学出版社,2002 年 8 月
张娟等,具有饱和接触率的 SEIS 模型的动力学性质,西安交通大学学报,第 36
卷第 2 期:204-207,2002
Marc Lipsitch,Ted Cohen et al.Transmission dynamics and control of severe acute
respiratory syndrome.Sciencexpress Report.www.sciencexpress.org,23 May 2003
匿名,专家盘点政府采取的控制非典的 9 项措施,http://fdfz.Zjgws.com,2003 年
9 月
林 国 基 等 , 用 小 世 界 网 络 模 型 研 究 SARS 病 毒 的 传 播 , http :
//162.105.8.101/sars/wangluomoxing.htm,2003 年 9 月

 

  • 27
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

2024年华数杯数学建模

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值