其他相关:
我们在进行数据分析时,很多时候需要提取出患某种疾病的患者的实验室指标,比如患者的血气,血常规等指标。
小编今天以提取患“肺栓塞”患者的实验室指标为例子,教大家如何提取mimiciv数据库的实验室指标。
目录
01 提取指标
小编本次要提取的指标是患有“肺栓塞”的患者的以下实验室指标:“血红蛋白”,“D二聚体”,“葡萄糖”。
提取的最终结果如下:
02 操作步骤
第一步,因为mimic中的疾病数据是根据icd编码查找的,所以我们需要先找出“肺栓塞”对应的icd编码,从下表可以看出肺栓塞的icd编码大部分都是以“415“开头的
第二步,我们需要根据icd编码从诊断表diagnoses_icd中查出患了“肺栓塞“的患者的信息,并根据患者分组,此处小编已经把所有患者都查出来了,患了“肺栓塞”的患者标志为1,没有患这个病的标志为0
第三步,查询实验室指标对应的itemId,这需要从字典表d_labitems中根据指标标签查询,小编这里只查询了“血红蛋白”的itmeId,我们查询的是血气中的血红蛋白,其他指标查询方法类似
第四步,从实验室指标表labevents查找实验室指标的信息,并根据患者分组
03 合并结果
小编现在已经分别查询出来了患了“肺栓塞”的病人,以及对应的实验室指标,最后需要把这些SQL语句合并后,才能输出在一张表格,其中使用了with子查询,分别把诊断数据跟实验室指标数据作为子查询,以下是完整的SQL解释。
为了方便大家的学习,小编已经把完整的SQL脚本整理好放在后台,如果需要本次教程的SQL脚本,关注公众号“科研收录”,后台回复“肺栓塞”即可获取脚本。