MIMIC数据提取教程 - 提取入住ICU第一天生命体征(血氧饱和度、血压、呼吸、体温)

图片

数据源:mimiciv数据库2.2版本

一、MIMIC数据库的subject_id,hadm_id,stay_id

图片

  • subject_id(患者标识符):这是用于唯一标识数据库中每个患者的数字标识符。(身份证)

  • hadm_id(医院入院事件标识符):这是用于唯一标识每次患者进入医院的事件的数字标识符。一个患者可能有多次入院,每次入院都有一个唯一的hadm_id。通过hadm_id,可以检索与特定入院事件相关的信息,如诊断、治疗记录等。(住院号)

  • stay_id(医院住院事件标识符):stay_id用于唯一标识患者在医院内的每个连续住院事件。在某些情况下,一个hadm_id可能对应多个stay_id,表示患者在医院期间可能经历了多个不同的住院事件。(进入ICU住院的ICU识别号)

  • 总结一下,通俗来讲,subject_id对应的就是我们的身份证号,每个患者只有唯一一个subject_id,hadm_id对应的就是医院住院号,患者可以每次就诊时注册不同的hadm_id,stay_id是只有患者住院期间入住ICU才有stay_id,每次进入ICU住院stay_id号可以不一样。(患者有且只有一个subject_id,而subject_id可以对应多个hadm_id,也可以对应多个stay_id)

图片

上面这幅图,表示同一个病人(subject_id=16391076)多次住院,每次住院注册了不同的hadm_id,然后住院期间进入了icu使用了不同icu识别符号(stay_id分别有38690181,35392191)。

二、初步筛选出符合某个疾病(高血压性心脏病)诊断的subject_id,hadm_id,stay_id

在mimic_hosp文件夹里面找到d_icd_diagnose表

图片

我们可以看到d_icd_diagnoses表(Diagnosis ICD Codes)包含有关国际疾病分类(International Classification of Diseases,ICD)的诊断代码的信息。

这个表主要用于存储诊断代码及其对应的描述信息。以下是该表包含的一些列(columns)及其解释:

包含国际疾病分类(ICD)第9版和第10版的诊断代码。icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复,如01622和1622代表不同疾病。

  • icd_code(ICD代码):这是国际疾病分类系统中的诊断代码。ICD代码是一种标准化的医学编码系统,用于识别医学诊断和程序。

  • icd_version(国际诊断编码版本):主要是icd_code不同的诊断代码版本,在mimic数据库中有9和10版本

  • long_title(详细标题):包含ICD代码的详细描述或标题,通常提供更详细的信息,以便更好地理解该诊断。

为了方便查询我们可以把long_title翻译一下,新建一个自己的表

图片

需要的同学可以直接后台回复【d_icd_cn】获取已经翻译好的文件,导入到数据库

导入方法:我们以public数据库为例,点击tables,再点击import wizard

图片

选择csv file, 再点击next

图片

选择add file, 添加d_icd_cn文件

图片

图片

图片

图片

图片

图片

图片

一路next, 最后start, 就导入进来了

图片

三、高血压性心脏病

以高血压性心脏病为例,在d_icd_diagnose表中找到符合高血压性心脏病的icd_code,并放work数据库下的d_icd_Hypertensive_heart_disease中

图片

图片

代码解释:

  • SELECT d.*: 从表 d_icd_diagnoses 中选择所有列(*表示所有列)

  • from mimiciv_hosp.d_icd_diagnoses d : 从名为 mimiciv_hosp 的数据库中的表 d_icd_diagnoses 中选择数据,并将其别名为 d

  • WHERE d.long_title LIKE '%Hypertensive heart disease%': 对选定的行进行筛选, 只选择那些 long_title 列中包含字符串 'Hypertensive heart disease' 的行。

  • LIKE 是一个模糊匹配操作符,% 表示任意字符的任意次数。

  • 请大家记住这个用法,LIKE '%Hypertensive heart disease%'表示只要是高血压性心脏病的诊断都能查出来,例如上面代码可以将原发性高血压性心脏病或继发性高血压心脏病或其他原因高血压性心脏病等符合诊断的icd_code查询处理。

这个类似问题详细解释可以看前面的文章, 其中有用中文查询疾病的示例

MIMIC数据提取教程 -  如何提取患有肥胖症疾病的患者?

图片

四、 找到符合诊断的icd_code代码后,链接diagnoses_id表,提取符合高血压性心脏病诊断的病人信息(subject_id,hadm_id)

在mimiciv_hosp文件夹里面找到diagnoses_id表

图片

将d_icd_Hypertensive_heart_disease表中的icd_code与diagnoses_id表中的icd_code进行链接,提取符合高血压性心脏病病人的subject_id,hadm_id,并放入表subject_id_Hypertensive_heart_disease中

图片

图片

五、 高血压性心脏病哪些人入住icu

链接mimic_derived文件夹里面的icustay_detail表就可以了

关于icustay_detail表的探索,可以看这篇文章 MIMIC-IV数据分析 - 使用R语言探索icustay_detail视图

-- 联接icustay_detail表select i.*into work.icu_Hypertensive_heart_disease from work.subject_id_Hypertensive_heart_disease h2INNER JOIN mimiciv_derived.icustay_detail ion h2.subject_id=i.subject_id AND h2.hadm_id=i.hadm_id

图片

图片

六、 提取入住icu的高血压性心脏病病人的检验指标、生命体征(以白细胞为例)

我们利用blood_differential、chemistry、enzyme、vitalsign等视图,配合常用的查询语句,便可以提取患者在每次入院时,整个住院过程中的实验室或者生命体征指标

类似文章可查看前文: MIMIC数据提取教程 - 如何提取患者入ICU后第一个WBC和SpO2值

有些同学说自己没有blood_differential、chemistry、enzyme表,那么你需要安装官方视图:

手把手教会你认识跟安装MIMIC-IV物化视图

MIMIC-IV数据库衍生表格mimic_derived配置和使用

图片

打开mimic_derived文件夹里面的blood_differential表

在blood_differential表中可以看到有白细胞的信息,使用通式代码进行链接即可,并将白细胞放在表wbc_icu_hypertensive_heart_disease

图片

七、 提取入住ICU第一天生命体征(血氧饱和度、血压、呼吸、体温)

打开mimic_derived文件夹里面的表first_day_vitalsign

这个表是由官方代码 mimic-iv/concepts_postgres/firstday/first_day_vitalsign.sql生成

图片

MIMIC-IV的first_day_vitalsign视图提供了患者第一天测量的生命体征指标的最小、最大值与平均值

生命体征指标视图所涵盖的指标

图片

图片

图片

图片

SQL SELECT INTO 语句

通过 SQL,您可以从一个表复制信息到另一个表。

SELECT INTO 语句从一个表复制数据,然后把数据插入到另一个新表中。

图片

关注公众号, 【科研收录

图片

觉得微信公众号阅读不方便的也可关注我的知乎: 

图片

世界地图矢量数据可以通过多种网站进行下载。以下是一些提供免费下载世界地图矢量数据的网站: 1. Open Street Map (https://www.openstreetmap.org/): 这个网站可以根据输入的经纬度或手动选定范围来导出目标区域的矢量图。导出的数据格式为osm格式,但只支持矩形范围的地图下载。 2. Geofabrik (http://download.geofabrik.de/): Geofabrik提供按洲际和国家快速下载全国范围的地图数据数据格式支持shape文件格式,包含多个独立图层,如道路、建筑、水域、交通、土地利用分类、自然景观等。数据每天更新一次。 3. bbbike (https://download.bbbike.org/osm/): bbbike提供全球主要的200多个城市的地图数据下载,也可以按照bbox进行下载。该网站还提供全球数据数据格式种类齐全,包括geojson、shp等。 4. GADM (https://gadm.org/index.html): GADM提供按国家或全球下载地图数据的服务。该网站提供多种格式的数据下载。 5. L7 AntV (https://l7.antv.antgroup.com/custom/tools/worldmap): L7 AntV是一个提供标准世界地图矢量数据免费下载的网站。支持多种数据格式下载,包括GeoJSON、KML、JSON、TopJSON、CSV和高清SVG格式等。可以下载中国省、市、县的矢量边界和世界各个国家的矢量边界数据。 以上这些网站都提供了世界地图矢量数据免费下载服务,你可以根据自己的需求选择合适的网站进行下载
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值