一、下载MIMIC数据步骤
1.下载MIMIC-IV数据库时,会遇到下图所示的情况

点击
,或者进入physionet官网注册账号,网址PhysioNet
|
使用edu结尾的邮箱 |

注册后physionet会给邮箱发送激活链接,点击激活链接进入网页则激活成功,申请到physionet账号后,进行下一步。
2.在CITI program上注册账号,完成一个测试
登录网站CITI - Collaborative Institutional Training Initiative (citiprogram.org)
|
点击 |

|
|
|
|
|
|

第2页填写相关信息,带星号的是必须要填的内容
|
名字 |
|
姓氏 |

第3页填写密码,安全问题等

第4页
|
China |

完成后有个选项是是否需要学分和其他课程,选NO,继续填详细信息,机构邮箱可以随便填另外的邮箱
然后进入课程选择,就可以进行考试了

只用回答问题1,2,5



|
点击 |

课程有两个模块,都需要完成


生成的报告如下图所示

3.回到physionet网站,搜索MIMIC-IV,进入


进入申请页面


|
填写研究内容 |

证明人邮箱需要是发表过SCI作品的邮箱,最后,点击提交,之后大概一周左右证明人会收到确认邮件,里边有一个确认链接,证明人点击链接确认后,申请就通过了,就可以下载数据了。
|
点开后,再点我同意就可以下载了 |

二、MIMIC-IV数据的说明
MIMIC-IV来自两个院内数据库系统:EHR和ICU。MIMIC-IV分为两个模块:hosp和icu。总共患者数量为299712,每次入院为一次记录,共431231条记录。
1.Hosp模块
Hosp模块包括来自EHR的数据,包括患者的人口统计、疾病诊断、实验室检测、药物治疗、生命体征等数据。共22个文件。

admission文件记录的是患者的入院信息,以每次入院为单位,每次入院都会有一个单独的hadm_id,而每个患者有唯一的subject_id,该文件内部各标签含义如下。
| name |
description |
| subject_id |
患者id |
| hadm_id |
住院id |
| admittime |
入院时间 |
| dischtime |
出院时间 |
| deathtime |
死亡时间,如果患者在医院内死亡,则记录死亡时间 |
| admission_type |
入院类型,患者被接收到医院的方式,按入院紧迫性分为9种,如急诊 |
| admit_provider_id |
收治患者的医生或者护理人员id |
| admission_location |
入院地点,患者被接受到医院的具体位置,如急诊室 |
| discharge_location |
出院去向,患者离开医院后的具体位置,如家庭、养老院 |
| insurance |
患者的保险类型 |
| language |
语言 |
| marital_status |
婚姻状况 |
| race |
种族 |
| edregtime |
进急诊时间 |
| edouttime |
出急诊时间 |
| hospital_expire_flag |
是否在住院期间内死亡, 1 是 0 不是 |
d_hcpcs文件及记录了与医疗程序编码相关的信息,包括不同医疗程序的名称、描述、代码等内容。
| name |
description |
| code |
医疗程序编码,用于识别不同的医疗程序 |
| category |
医疗程序的类别 |
| long_description |
医疗程序的详细描述 |
| short_description |
医疗程序的简短描述 |
d_icd_diagnoses文件记录了与ICD(International Classification of Diseases,国际疾病分类)诊断编码相关信息。
| name |
description |
| icd_code |
ICD诊断编码,用于识别不同的疾病 |
| icd_version |
ICD版本 |
| long_title |
ICD诊断编码的详细描述或标题,提供有关该疾病诊断的更详细信息 |
d_icd_procedures文件记录了与ICD(International Classification of Diseases,国际疾病分类)手术编码相关信息。
| name |
description |
| icd_code |
ICD手术编码,用于识别不同的手术过程 |
| icd_version |
ICD版本 |
| long_title |
ICD手术编码的详细描述或标题,提供有关该手术过程的更详细信息 |
d_labitems文件记录了与实验室检验项目相关的文件,包含了与实验室检验项目(Lab Item)有关的信息。
| name |
description |
| itemid |
实验室检验项目的Id |
| label |
实验室检验项目的标签或名称,用于描述该实验室检验项目 |
| fluid |
液体类型,表示该实验室检验项目所涉及的生物体液类型,如尿液等 |
| category |
实验室检验项目的类别,用于将不同的实验室检验项目进行归类 |
diagnoses_icd文件ICD诊断数据,记录了与患者诊断相关的国际疾病分类(ICD)编码和描述。
| name |
description |
| subject_id |
患者id |
| hadm_id |
住院id |
| seq_num |
诊断顺序号,表示该诊断在所有诊断中的顺序 |
| icd_code |
诊断编码,指诊断的疾病或症状在国际疾病分类(ICD)中的编码 |
| icd_version |
ICD版本 |
drgcodes文件记录了诊断相关组代码数据,用于医疗费用计算和统计分析,drg即Diagnosis Related Group.
| name |
description |
| subject_id |
患者id |
| hadm_id |
住院id |
| drg_type |
诊断相关组(Diagnosis Related Group,简称DRG)的类型。DRG是根据患者入院诊断、手术情况、年龄、性别等因素进行分类的一种方法,用于决定医院住院费用的支付 |
| drg_code |
诊断相关组代码,用于标识具体的DRG类别 |
| description |
诊断相关组的描述,提供对DRG类别的文字说明 |
| drg_severity |
诊断相关组的严重程度。通常使用数字表示,较高的数字表示更严重的疾病或手术 |
| drg_mortality |
诊断相关组的死亡率指数。通常使用数字表示,较高的数字表示更高的死亡风险 |
emar文件记录了电子药物管理数据
| name |
description |
| subject_id |
患者id |

最低0.47元/天 解锁文章
793

被折叠的 条评论
为什么被折叠?



