疾病负担研究（GBD）-数据下载及解读

最新推荐文章于 2025-04-11 12:09:23 发布

小明学习室

最新推荐文章于 2025-04-11 12:09:23 发布

阅读量9.1k

点赞数 3

分类专栏： GBD数据库文章标签：回归数据挖掘人工智能

本文链接：https://blog.csdn.net/weixin_44240228/article/details/121960894

版权

本文介绍如何下载GBD数据并聚焦2019年全球及各大洲食管癌的年龄校正发病率和死亡率分析。通过R语言进行数据处理，探讨数据随时间变化的趋势。提供下载数据的方法和解析数据的初步步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

接着上一节，我们介绍了GBD大概的情况，今天我们来聊一聊如何下载数据，并利用下载的数据进行有目的的取舍分析。因为涉及的内容挺多，我们就限定某一部分人群进行描述，掌握了这一部分，其他部分基本上可以类推，采用的分析软件使用R语言就行分析。

比如我们现在想要分析2019食管癌全球及各大洲的年龄校正后的发病率、死亡率这两个数据，以及随时间变化的情况，其他几个衡量数据基本上可以类推。

进入主界面后我们首先需要限定条件后下载我们想要的数据

年份我们全部勾选

地区我们选择Select only GB

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小明学习室

关注关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
9
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

8篇2章4节：GBD 数据库的数据深度解读（二）

DAT｜R科学与人工智能

04-28

714

GBD数据结构设计的优势在于其全面和系统性：它覆盖了全球绝大多数国家和地区（含多国分省估计），整合了传染病、非传染病、伤害和风险因素的健康指标，对不同年龄、性别均提供细分估计。这种层级化、多指标的框架便于比较和汇总，使政策制定者能够在同一平台下比较各健康问题的重要性和趋势。

导师：少见，GBD也能联合机器学习了？看看人家暨南大学是怎么发文一区top的...

weixin_47988917的博客

02-19

915

引言发文可别卷错方向了，看看GBD数据库＋机器学习这条崭新的发文赛道！今天分享的这篇文章，中国学者基于GBD数据，构建了XGBoost模型，用其预测碘缺乏症到2050年的疾病负担，并使用SHAP法对该模型进行解释，拿下IF=8.0！接下来让我们一起来看看今天这篇文章。碘缺乏症（ID）是指从胚胎发育至成人期由于碘摄入量不足而引起的一系列病症，可能导致甲状腺肿大、认知障碍等严重后果。准确预测未来趋势...

9 条评论您还未登录，请先登录后发表或查看评论

疾病负担研究（GBD）介绍

热门推荐

weixin_44240228的博客

12-10

1万+

今天我们来聊一聊第一个公共数据库——GBD数据库，全称叫做global burden of disease（全球疾病负担），该数据库每年都会更新，目前已经更新到GBD2019。这里直接给大家贴出网址：Global Burden of Disease Study 2019 (GBD 2019) Data Resources | GHDx 上图中红色圈圈标识的就是数据库的数据获取界面的链接，大家直接点击即可. 数据的检索十分方便： Context下拉菜单中可以选择不同的选项，默认是caus

3.5/Q2，GBD数据库最新文章解读

2501_91172097的博客

03-23

604

2021 年，全球新增食管癌病例 576,529 例，年龄标准化发病率 (ASIR) 为每 100,000 人 6.65 例，自 1990 年以来下降了 24.87%。到 2050 年，ASIR 预计将降至每 100,000 人 6.17 人，ASDR 预计将降至每 100,000 人 5.23 人，但预计绝对病例数和死亡人数将上升。从2021 年全球疾病负担 (GBD) 研究中收集了 EC 负担数据，包括发病率、死亡率和伤残调整生命年 (DALY) 估计值以及风险因素，涵盖 204 个国家和地区。

高分严选！挑战5天完成一篇GBD

MR_SCI_help的博客

03-02

1051

这个问题其实很好解决，比如这篇文章用的是到2019年的数据，那么你完全可以用更新到2021年的数据来分析，并且加入一些新的方法，如预测模型等，还可以限制地区和国家，比如只关注亚洲人群或者中国。这就是GBD文章的主要结果啦，下载好数据以后，后面的分析实际上是非常简单的，选题才是最重要、最费时间的，也是最容易浮躁滴，静下来，方向对了，就一定能出成果。在看文献的过程中发现了一篇用的方法都满足我需求的文章，且这个期刊也是我的目标杂志，影响因子、发文量、首次回复时间都很不错，而且所采用的方法我都已经掌握了，

qq_41248240的博客

03-04

1663

各位医界同仁、科研伙伴们，注意啦！全球疾病负担（GBD）数据库即将迎来一次关键更新。据可靠消息，在 3 月 7 日，GBD 数据库将上线 2023 年的最新数据，不过此次更新有个重要限制 —— 仅对数据库协作组成员开放。

疾病负担研究（GBD）-如何绘制GBD相关性图

weixin_44240228的博客

02-19

3545

巨简单！免费教你，公共数据库GBD的数据下载！今天刚发了一篇BMJ，心动不如行动...

weixin_47988917的博客

06-13

8709

GBD数据库真属于宝藏级了！又霸榜Lancet，又发表BMJ的，本公众号之前已经解读了3篇Lancet文章，感兴趣可以看看，了解一下这个数据库。GBD在手，毕业不愁！如何提前了解最新数据《GBD2021》？来看看这篇Lancet医学顶刊Lancet的常驻选手，宝藏级数据库，不准你不知道！IF=168.9！0实验发医学顶刊柳叶刀，来看看这个公开数据库，带你发文SCI！今天，中国学者用GBD2019数...

GBD最新数据公布啦！免费获取，无偿使用！

weixin_47988917的博客

05-17

776

培训通知，快来听课！GBD直播培训班，重磅来袭，就在6.1-6.2日GBD数据库是什么？好发文吗？是免费的吗？相信现在很多朋友对这个数据库不了解。但就是这个还不被大多数人熟知的公共数据库，早就在医学顶刊展露头角了！今天我们就来聊一聊这个免费的公共数据库！就在昨天，公共数据库GBD(全球疾病负担) 刚刚发布最新版2021年数据集。全部数据集可以免费下载GBD数据库（Global Burden of ...

GBD最新数据公布啦！免费使用！欢迎参加直播课，我们指导写论文

郑老师统计

05-20

1083

GBD数据库是什么？好发文吗？是免费的吗？相信现在很多朋友对这个数据库不了解。但就是这个还不被大多数人熟知的公共数据库，早就在医学顶刊展露头角了！今天我们就来聊一聊这个免费的公共数据库！就在昨天，公共数据库GBD(全球疾病负担) 刚刚发布最新版2021年数据集。全部数据集可以免费下载GBD数据库（Global Burden of Disease）：全球疾病、伤害和风险因素负担研究是迄今为止规模最大...

中国蝉联第一！GBD数据库2024年大盘点，发文量稳步上升中

weixin_47988917的博客

01-15

2438

要说医学领域2024年最具亮点的数据库，绝对非GBD莫属！全球疾病负担（Global Burden of Disease, GBD）数据库是一个由全球卫生研究机构组织的综合数据库，用于评估和分析全球及各地区的疾病、伤害和风险因素的健康影响。2024年那么多人进军GBD有何原因？数据多、科室广、准确率高！GBD 数据库是全球最全面的健康数据库，涵盖了1990到2021年，204个国家和地区的健康数据...

疾病负担研究（GBD）——如何绘制疾病成分比

weixin_44240228的博客

05-26

2090

疾病负担研究（GBD）——如何绘制疾病成分比

gdb所需源文件总全下载

07-08

包含expat_2.0.1.orig，gdb-7.6，ncurses-5.9

基于GBD数据的年龄-时期-队列模型构建

weixin_46579654的博客

06-05

6388

APC 模型应用于估计年龄时期和队列三者独立因素对慢性非传染性疾病发病率或死亡率的影响。

7.0/Q1，GBD数据库最新高分文章解读！

gsky_sci的博客

01-07

518

2021 年全球幼儿 RB 的年龄标准化发病率 (ASIR)、年龄标准化死亡率 (ASMR) 和年龄标准化 DALYs 率 (ASDR) 分别为 0.09 [95% 不确定区间 (UI)：0.05 至 0.13]、0.04（95% UI：0.03 至 0.06）和 3.65（95% UI：2.21 至 4.96）。本研究深入了解了 0-9 岁儿童视网膜母细胞瘤 (RB) 的全球负担，研究了 1990 年至 2021 年各年龄、性别、地区和 SDI 水平的发病率、死亡率和 DALY。

8篇2章1节：认识全球疾病负担数据库 GBD

最新发布

DAT｜R科学与人工智能

04-11

656

全球疾病负担数据库（GBD）是一项全面的区域性和全球性疾病负担研究项目，用于评估主要疾病、伤害和风险因素导致的死亡率和残疾情况。全球疾病负担研究是来自 160 多个国家的 12000 多名研究人员的合作成果。在首席研究员克里斯托弗・J・L・默里的领导下，全球疾病负担研究的总部位于华盛顿大学健康指标与评估研究所（IHME），并由比尔及梅琳达・盖茨基金会资助。

没思路没数据？来看看GBD，未被发掘潜力无限 | GBD数据库周报（5.22~5.28）

weixin_47988917的博客

06-05

1232

全球疾病负担（GBD）是迄今为止规模最大、最全面的一项研究，旨在量化不同地区和不同时期的健康损失，从而改善卫生系统并消除差异。该研究由华盛顿大学健康指标与评估研究所 (IHME) 牵头，是一项真正的全球性研究，来自 160 多个国家和地区的 11,000 多名研究人员参与了最新更新。GBD 创建了一个独特的平台来比较不同年龄组、性别、国家、地区和时间的疾病、伤害和风险因素的严重程度。对于决策者、卫...

首发亮相！GBD数据库，启动！| GBD数据库周报（4.24~5.7）

weixin_47988917的博客

05-14

1430

一区IF 4.8！上海交大学者挖掘GBD数据，描述性分析出多张新图

weixin_47988917的博客

12-05

1167

引言常规GBD分析套路不得审稿人的心？不妨从美化结果图表入手！今天介绍的这篇文章，虽然使用的统计分析方法很常规，但是其描述性分析GBD数据的结果图却让人眼前一亮又一亮！怪不得中国学者能够凭借这篇文章拿下一区高分！接下来，快让我们一起来看看吧！与贫困相关的罕见传染病（rIDPs）是指一组主要影响生活在贫困和边缘地区人群的传染病。由于缺乏足够的关注和资源，这些疾病在全球卫生领域常被忽视。目前，由于全球...

如何利用GBD数据库与PAF

01-24

### 如何使用GBD数据库与PAF进行集成和操作 #### 1. 理解GBD数据库和PAF的概念全球疾病负担（Global Burden of Disease, GBD）是一个全面的公共卫生研究项目，旨在量化健康损失并提供有关全球、区域、国家乃至地方层面的主要健康问题的数据[^1]。人口归因分数（Population Attributable Fraction, PAF）是一种流行病学指标，用于估计由于暴露于特定风险因素而导致的疾病或死亡的比例。 #### 2. 获取GBD数据为了获取GBD数据，可以访问官方提供的在线工具——可视化工具和GHDx (Global Health Data Exchange)[^2]。这些平台允许用户下载所需的时间序列数据集，包括但不限于发病率、患病率、伤残调整生命年(DALYs)等指标。 #### 3. 准备环境设置在本地计算机上安装必要的软件包来进行数据分析是非常重要的一步。Python编程语言及其丰富的科学计算库非常适合处理此类任务： ```bash pip install pandas numpy matplotlib seaborn requests ``` 对于更复杂的统计建模需求，则可能还需要额外安装`statsmodels`或其他专门针对生物医学领域设计的R包。 #### 4. 加载和预处理GBD数据一旦获得了所需的CSV文件或者其他格式的数据源之后，就可以开始加载它们到工作环境中去了。这里给出一段简单的Python代码片段作为示范: ```python import pandas as pd # 假设已经从GBD网站下载了一个名为'gbddata.csv'的数据表单 df = pd.read_csv('gbddata.csv') # 查看前几行记录以确认读取成功与否 print(df.head()) ``` #### 5. 计算PAF值基于所选的风险因子以及目标疾病的关联强度参数(比如相对危险度RR)，可以通过下面这个通用公式来估算PAF: \[ \text{PAF} = \frac{\sum_{i}(p_i(RR_i-1))}{\sum_ip_iRR_i}\] 其中\( p_i \)表示第 i 类人群中的比例；而 \( RR_i \)则是指相对于未暴露组而言，在该类人群中观察到的结果发生的几率增加倍数。具体实现时可以根据实际情况编写相应的函数完成这一过程： ```python def calculate_paf(prevalence_list, rr_list): numerator = sum([pre * (rr - 1) for pre, rr in zip(prevalence_list, rr_list)]) denominator = sum([pre * rr for pre, rr in zip(prevalence_list, rr_list)]) return numerator / denominator if denominator != 0 else None ``` #### 6. 结果解释与应用最后一步就是解读所得出的具体数值，并考虑将其应用于实际场景当中去。例如说如果发现某项环境污染物质对当地居民健康的负面影响显著高于平均水平的话，那么相关部门或许就应该采取措施减少这种污染物排放量了。