MIMIC-III数据库的应用(一)
MIMIC-III是由麻省理工学院计算生理学实验室开发的公开可用数据集,其中包含了>60000次住院相关的数据,时间跨度为2001-2012年,包括人口统计学,生命体征,实验室测试、药物等。Nature上的一篇文献描述了该数据库(http://www.nature.com/articles/sdata201635)。
关系型数据库与SQL
关系数据库是通过共享的键连接在一起的表的集合。这种组织方式有利于保持数据的完整性并实现更快的分析和更高效的存储。
SQL(Structured Query Language),结构化查询语言是一种数据库查询和程序设计语言,用于存取数据及查询、更新和管理关系数据库系统。其最基本的代码为:
SELECT *
FROM table
SELECT 选择表格总的列,FROM表示选择的表格。例如,选择MIMIC-III数据库中「patients」表格中患者的ID,出生日期,以及性别:
SELECT subject_id,dob,gender
FROM mimiciiii.patients
WHERE 语句的运用
有时候,我们查询的时候需要查询符合某个条件的数据,而不是整个表格,例如找到所有女性的患者,那么需要使用WHERE关键词。如: