GBD数据库预测2050是怎么做的?有了这个模型你也能发一区SCI

详情请点击下方查看:

2024年"重复测量资料分析"直播课来了!混合效应+轨迹模型两大热门方法!


在众多已发表的GBD(全球疾病负担)研究文章中,大多数学者不限于描述疾病现状,还会加入预测模型以分析未来趋势。今天,我们就来简要介绍如何利用ARIMA模型对GBD数据库进行预测分析。

在已发表的文献中,有很多种预测方法来预测数据,常见的包括贝叶斯年龄周期队列(BAPC)模型,ARIMA模型,nordpred模型等。但在进行未来数据预测时,常常会有人觉得ARIMA模型纳入的数据较少,R语言中计算简单而质疑他的预测能力。

简单的方法并不意味着不可靠;事实上,简单性往往能够带来清晰性和易用性,特别是在数据分析领域。

今天我们将以一篇GBD预测文章为例,为大家解读如何用ARIMA模型进行预测。

2024年2月8日,英国伦敦国王学院的作者在《The LANCET Reginal Health-Europe》中发表的题为:“Burden of intracerebral haemorrhage in Europe: forecasting incidence and mortality between 2019 and 2050”的研究论文,旨在使用现有脑出血数据预测2019-2050年的未来发病率与死亡率数据。

99317a5a176204aa170f0fe8c84053ce.png

本文有两大亮点:第一点为在ARIMA模型中添加了外生变量SDI,共同预测未来数据;第二点为通篇文章使用预测后数据进行描述性统计,与题目相呼应。

接下来本文将从这两点进行简单介绍。

ARIMA(AutoRegressive Integratd Moving Average)模型是一种用于时间序列分析和预测的统计模型。它结合了自回归(AR)、差分(I)和移动平均(MA)三个部分,用于捕捉时间序列数据的动态特征。

先前本公众号就分享过一篇GBD数据库做时间序列分析发二区top的文章,同样使用的ARIMA模型对疾病进行预测,感兴趣的不妨先看一下:

惊了!用GBD数据库做时间序列分析也能发二区top,高分思路请收藏!

通常情况下,ARIMA模型的建立包括以下步骤:

1. 确定时间序列是否平稳,如果不平稳,则进行差分以获得平稳序列;

2. 通过观察自相关图(ACF)和偏自相关图(PACF)来确定合适的p和q值;

3. 使用拟合的ARIMA(p, d, q)模型对时间序列数据进行预测。

如果要使用ARIMA模型,我们该如何添加外生变量?

从公式的角度来看,仅需在ARIMA模型的计算中再添加一项SDI及其系数,我们就能将把这个公式纳入我们自己的研究。下面是本文学者所使用的公式: 

78969b270048acbaac1effe39437c5ba.png

为什么会认为文章内容也是一大亮点呢?

尽管可以参考其他GBD文章,但这篇文章的内容与常规的GBD略有不同,纳入ARIMA模型后,研究团队能在已有数据的基础上进行更为精准的预测,并减少异常值与预测结果的影响,结局更准确。

接下来我们来看简单一下这篇文章的结果,大家可以这篇文章与其他GBD预测文章进行比较:

在下表中,我们列出了欧盟 28 个国家在不同健康情景(参考、更好和更差)下观察到的 2019 年新增脑出血病例数,以及相应的 2050 年预测。

该表还突出显示了 2019 年与 2050 年参考预测之间计数和年龄标准化比率的百分比变化。

e7e20cff821dd8a84721c1588c6efd79.png

表1 2019年和2050年的脑出血病例数量以及按国家划分的数量和年龄标准化率的百分比变化

接着使用1990-2019年数据预测2020-2050年的未来趋势,从下图中我们可以看到,研究团队分别预测了未来的发病人数、死亡人数、粗发病率、粗死亡率、年龄标准化发病率、年龄标准化死亡率。

研究结果表明,如果欧盟国家在社会经济和脑出血危险因素方面经历更糟糕的健康趋势,那么,脑出血风险因素的健康趋势将增加 16.7%。预计到 2050 年(95% UI,8.7%–25.3%),新增患者总数可能达到 163.9(95% UI,141.6-190.3)千人(表 1 ,图 1 )。

aa40ba9e70762aa2ddf9a03ae91da091.png

图1 欧洲随时间推移的脑出血发病率和死亡率,预测截至 2050 年。ICH 表示脑出血。

相反,如果各国遵循更好的健康轨迹,预计脑出血病例会减少 10%(95% UI,16.4%–2.3%)。

关于死亡率,研究团队的预测结果表明,2050 年将有 144.2 人(95% UI,122.9–172.2)人死于脑出血,与 2019 年相比增加 8.9%。这与该地区自 1990 年以来观察到的 22% 的下降形成鲜明对比(图1 、表2 )。

c77658a7baa2056f21e712c53b51c532.png

表2 2019年和2050年脑出血死亡人数以及按国家划分的计数和年龄标准化率的百分比变化

据观察,欧洲女性脑出血的绝对负担略高于男性,且随着年龄的增长,差异显著扩大。一般来说,直到80岁,年龄每增加五年,脑出血病例数就会增加大约三分之一,而死亡率则几乎增加一倍(图2 )。

6b7dadc8cdaedffa4d0c147266a47528.png

d42523d7fb521d3feec866028396e1d2.png

图2:1990 年、2019 年和 2050 年按年龄和性别分组的脑出血发病率和死亡率参考预测以及欧洲人口结构

尽管每个国家的标准化费率都有所下降,幅度约为五分之一到一半,但大多数欧盟国家的粗率和计数数字要么上升,要么略有下降(图3 、图4 、图5 )。

e2ce524b14a96860ad1e9d052b291bc0.png

图3:2019 年至 2050 年欧洲脑出血发病率和死亡率的观察和预测变化。点的大小并不传达具体信息;它用于说明时间序列的方向并在重叠的情况下提高清晰度。国家根据 2050 年预测按升序排列。

下图直观地展示了发病率与死亡率在2019-2050年之间的变化率。

27d3f8f1e8ce4ebefa1e13dc65f5b439.png

图4:2050 年与 2019 年脑出血发病率和死亡率的百分比变化

分解分析显示了发病人数与死亡人数在危险因素、人口规模、人口老龄化上的占比。

b18010f0b3cea1e851f2841793ccfef7.png

图5:2019年至2050年欧洲脑出血病例和死亡人数百分比变化分解分析。国家根据其总体预测变化按升序排列。ICH表示脑内出血。

综上所述,尽管欧洲在降低脑出血风险和相关死亡率方面取得了相当大的进展,但预计的趋势表明,患有这种疾病并死于这种疾病的人数不断增加。事实上,如果不持续努力加强风险因素的流行和控制并改进治疗方案,脑出血病例数和相关死亡人数可能会恢复到与 20 世纪 90 年代相当的水平。至关重要的是,在人口老龄化导致身体虚弱和合并症增加的背景下,更好地了解风险因素管理,为此类努力提供信息。

本文最大的亮点就是使用了具有外生变量SDI的ARIMA模型,这样能使预测的误差更小,更加准确。同时在文章内容上,不同于其他预测文章直接呈现1990-2019年的信息,这篇文章将所有的内容都用预测出来的值为基础以各种图表的结果呈现。

不过需要注意的是,使用ARIMA模型要求要求时序数据是稳定的(stationary),或者是通过差分化(differencing)后是稳定的。本质上只能捕捉线性关系,而不能捕捉非线性关系。


详情请点击下方:

欢迎报名,GBD公共数据库挖掘1对1指导高级班,快速发表SCI论文!

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值