Mimic-III 数据库挖掘探索——连续性肾脏替代治疗(CRRT)
前言
上个月建库成功,至今一个月过去了。
因为没有服务器,在本地电脑反复建了几次,linux系统/windows系统一应俱全[苦涩]。原始库和衍生库都建好了,数据基本备齐。
库建好了之后,又开始捡起之前的sql句子,开始库里面内容的探索。。。100多G的数据,不知道算不算大。。。
记得,六七年前跟随咨询团队去良品进行零售数据分析时用过了SAS的SQL句子,现在都1202年了,SAS也都出免费版了,良品也都上市了。而我还在苦逼的码代码,进行大数据挖掘。。。一边吃着良品的零食[苦涩]。从零售数据到医疗数据,也算是回归本业了,没想到那时学的一招半式还能派上用场。
数据分析的大概步骤
处理mimic库数据的过程大概步骤是:
- 根据你的想法,挑选对应的病人(ICU病人)集合;
- 根据你的想法,确定你要分析的X(自变量,指标)~Y(因变量,结局);
- 手动写SQL句子,获取对应病人集合的一个个Y数据;
- 对X~Y进行相应的分析。
打勾就能导出数据的系统搭建
前面的第一二点,就是立题啦,就是你睡不着的时候突然冒出来的想法。
第三点:重复性的查询数据,比如:要获取病人的性别