MIMIC 数据库是面向全球科研人员公开的公共大型临床数据库。详细记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、生存状态等详细信息,包含了多种类型ICU(外科监护室、内科监护室、创伤外科监护室、心脏病监护室、心外恢复监护室)的入住信息。
在这篇教程中,阿毅还是会基于上一篇的教程,教大家提取患者的生命体征指标。
注:本次教程基于mimiciv数据库2.2版本
一,确定疾病的ICD编码
在后台工具中输入高血压的英文"hypertension",点击搜索之后,就会把MIMIC数据库这种疾病的ICD编码显示出来,同时也会列出数据库中该疾病的患者总入院次数,阿毅建议大家做科研分析的时候,要尽量选择患者人数多的疾病进行分析,因为样本量大。
这里阿毅还是选择跟上个教程一样的ICD编码进行分析。
二,确定生命体征的指标编号
生命体征指标编号存在icu模块中的d_items表中,阿毅为了分析方便,也把这些编号整理在了后台管理系统中,这里我以血压指标为例,搜索生命体征指标编码,在搜索框中输入“Blood Pressure”即可搜索到各种血压的指标编码。
三,提取单个指标
从以上两步,阿毅已经知道了ICD编码跟指标编码,这样就可以根据这两个编码提取相关的指标,下面阿毅先提取“无创血压收缩压”
其他的指标提取方法也是类似。
四,合并指标
当提取完“血压收缩压”,“血压舒张压”,“血压平均值”之后,可以把这几个指标合并到一个SQL脚本中,以便把所有的生命体征指标导出成一张表格,使用Postgres的子查询将所有的指标合并到一起。
运行结果如下:
关注“科研分析”公众号,获取完整数据库脚本