【MIMICIII应用】(一)MIMICIII波型数据库说明
信息整理自官网 https://physionet.org/content/mimic3wdb-matched/1.0/
MIMIC-III数据库
多参数智能监测数据库(MIMIC-III)是一个免费开放的、公共资源的重症监护室研究数据库。该数据库于2006年由美国麻省理工学院计算生理学实验室以及贝斯以色列迪康医学中心(BIDMC)和飞利浦医疗共同发布。
MIMIC-III数据集主要包括波形数据集( MIMIC-III Waveform Database)和临床数据集( MIMIC-III Clinical Database)。
MIMIC-III波形数据库
MIMIC-III Waveform Database(官网链接)
MIMIC-III波形数据库匹配子集包含22,317条波形记录和22,247条数字记录,用于10,282个不同ICU病人。这些记录通常包括数字化信号,例如心电图, ABP,呼吸,和PPG,以及周期性测量,如心率、血氧饱和度、收缩压、平均血压和舒张压。
此数据库是MIMIC-III波形数据库,表示病人已被识别的记录,其相应的临床记录在MIMIC-III临床数据库。利用所有现有信息,通过大多数自动匹配和一些人工校正的过程,共发现22 317条波形记录(34%)和22 247条数字记录(35%),可与临床数据库中的相应病人联系起来。
数据文件说明
对于每个记录,创建了一个新的WFDB头文件,其中包含subject_ID以及记录的代理日期和时间。注意,原始信号文件(如3314767_0004.dat和3314767n.dat)和段头文件(例如3314767_0004.hea)与原始编号记录中的记录相同。
所有与特定病人相关的数据都被放置在一个子目录中,该子目录根据患者的 MIMIC-III 中的subject_ID命名。这些子目录被进一步划分为10个中间级别的目录(matched/p00到matched/p09).
每个匹配波形记录的名称为matched/pXX/pXXNNNN/pXXNNNN-YYYY-MM-DD-hh-mm,其中XXNNN是匹配的 MIMIC-III 临床数据库 subject_ID , YYYY-MM-DD-hh-mm 是替代性的年(如2196,以保护病人隐私)、月(01-12)和日(01-31),实际时间(00-23)和分钟(00-59)从记录的开始日期和时间得出。替代性日期与相应的MIMIC-III临床数据库记录相匹配。
在大多数情况下,波形记录与与相关联的波形记录同名的数字记录配对,并具有n加到最后。
通常有多个波形和数字记录对与给定的临床记录相关联;在这种情况下,所有的波形和数字记录对都会出现在同一个子目录中,它们的名称将显示它们的年代顺序。例如,模拟-III临床数据库记录p000079已匹配两个波形和数字记录对,命名为:
各mimic3wdb/matched记录也是未注明日期的mimic3wdb记录(即,它也属于完整的 MIMIC-III 波形数据库)。只有替代性日期mimic3wdb/matched标头(.hea)文件对匹配的子集是唯一的;其他文件具有表单的名称3*.hea和3*.dat,是完整数据库中同名文件的副本。
使用说明
以下示例说明了数据库的组织:
-
中间目录P04包含所有以名称开头的记录。p04(病人 subject_ID 在40000至49999间)
-
所有与病人44083相关的文件都包含在P04/p 044083目录中。该目录包含两个波形记录(p044083-2112-05-04-19-50和p 044083-2112-05-23-12-22)以及两个相关的的数字记录(p044083-2112-05-04-19-50n和p044083-2112-05-05-23-12-22n),两次单独入住ICU的记录 。
-
第一次停留的主波形头文件(P044083-2112-05-04-19-50.hea)表示记录的长度为20342033个样本间隔(约45小时),从212年5月4日19:50开始。这个日期,和 MIMIC-III 中的所有日期一样,都是匿名的,因为它被随机地移到了未来的几天里。 header(5)有关此文件格式的更多信息,请参见WFDB应用程序指南。
-
该波形记录由41个段(3314767_0001到3314767_0041)组成,如主头文件所示。layout头文件(3314767_layout.hea)表示四个ECG记录信号(II、AVR、V和MCL),并记录呼吸信号、PPG和动脉血压。并非所有这些信号都同时可用。
-
第4段的头文件(3314767_0004.hea)向我们显示,在这段时间内,有五个信号可用:三个ECG引线(II,V和AVR),一个呼吸信号(RESP)和一个PPG信号。
-
数字头文件(P044083-2112-05-04-19-50n.hea)显示,我们记录了各种测量,包括心率、侵入性和非侵入性血压、呼吸频率、ST段抬高、血氧饱和度和心律统计。就像波形一样,并非所有这些测量都是可用的。
-相关生理波形演示示例
通过 MIMIC-III 临床数据库演示,我们可以得知这位病人是男性,他的匿名出生日期是2057年11月15日(在ICU住院时,他已经54岁了):
这个ICUSTAYS表显示他曾一次进入SICU和两次进入CCU:
第一个对应于上述波形记录,如日期(2112-05-04)所示。注意,波形记录的开始和结束日期和时间并不总是与精确的输入或放电时间相匹配。
这个 hadm_id (125157)及 icustay_id (265615)链接到 MIMIC-III 中的其他表,这些表提供有关的进一步信息,例如,生命体征,实验室测试,药物和诊断。
参考文献
- Johnson, A. E. W., Pollard, T. J., Shen, L., Lehman, L. H., Feng, M., Ghassemi, M., Moody, B., Szolovits, P., Celi, L. A., & Mark, R. G. (2016). MIMIC-III, a freely accessible critical care database. Scientific Data, 3, 160035. https://dx.doi.org/10.1038/sdata.2016.35
- 陈静,李保萍.MIMIC-Ⅲ电子病历数据集及其挖掘研究[J].信息资源管理学报,2017,7(04):29-37.