github原址:https://github.com/MLforHealth/MIMIC_Extract
在做了前期的环境配置和相关函数生成文件之后,运行
python mimic_direct_extract.py
会报错,主要的报错原因如下:
- 我是在实验室服务器上运行的,这个连接psql数据库的时候默认端口是5432,也没有可以设置的地方,要自己根据原本函数的结构加一个自己的port上去。
- 如果报找不到icustays关系之类的错,官方的代码反馈区有写,是因为sql的路径是mimiciii,但是也要用到公共路径public,详细的解决方案原址在此:https://github.com/MLforHealth/MIMIC_Extract/issues/18
- 如果是连接数据库和SSL之类的出问题,应该要把各种配置文件中各个监听端口设置为所有IP可连接,具体可参考https://blog.csdn.net/qq_31489933/article/details/94871050
能够运行成功的话目前是这样的
应该需要挺久的,毕竟官方是这么说的
等数据跑完了再继续更新
第二天的更新:
发现报错了
原因是实际上 MIMIC-Extract 中还包含了 CCS 的表,而原始的 mimic 数据中是不包含这两个表的,因此,我们需要自己创建这两个表。
参考网址:
https://zhuanlan.zhihu.com/p/348750896
那么补充了ccs的表格之后,在 mimiciii schema 中创建了 45 个表格,这些表格主要是根据 mimic 提供的数据创建,在 public schema 中创建了 52 个表格,这些表格都是从 mimic 中提取出来的 concept。数据库中已经包含了我们需要的所有表格。
然后根据这个上面这个知乎的参考更改了一些pandas的API然后开始跑第二次。出结果了再更新。
finished。