MIMIC-Extract 项目使用教程
1. 项目的目录结构及介绍
MIMIC-Extract 项目的目录结构如下:
MIMIC_Extract/
├── Data/
├── Notebooks/
├── Resources/
├── Utils/
├── .gitignore
├── LICENSE
├── README.md
├── datapackage_io_util.py
├── heuristic_sentence_splitter.py
├── mimic_direct_extract.py
├── mimic_extract_env_py36.yml
├── mimic_querier.py
└── postgres_make_extended_concepts.sh
目录介绍:
- Data/: 本地存储待提取的数据。
- Notebooks/: 包含 Jupyter Notebooks,用于演示测试用例和在风险和干预预测任务中使用输出数据的示例。
- Resources/: 包含
Rohit_itemid.txt
文件,描述 MIMIC-III 和 MIMIC II 项目 ID 之间的相关性;itemid_to_variable_map.csv
文件,用于数据提取的主要文件,包含项目 ID 的分组以及哪些项目 ID 已准备好提取;variable_ranges.csv
文件,描述正常变量范围,协助提取适当的数据。 - Utils/: 包含运行 MIMIC-Extract 数据管道的脚本和详细说明。
- .gitignore: Git 忽略文件。
- LICENSE: 项目许可证文件。
- README.md: 项目说明文件。
- datapackage_io_util.py: 数据包 I/O 工具脚本。
- heuristic_sentence_splitter.py: 启发式句子分割器脚本。
- mimic_direct_extract.py: 数据提取脚本。
- mimic_extract_env_py36.yml: 项目环境配置文件。
- mimic_querier.py: MIMIC 查询器脚本。
- postgres_make_extended_concepts.sh: 用于构建扩展概念视图的脚本。
2. 项目的启动文件介绍
项目的启动文件是 mimic_direct_extract.py
。该文件是 MIMIC-Extract 数据提取的主要脚本,负责从 MIMIC-III 数据库中提取数据并进行预处理。
使用方法:
python mimic_direct_extract.py --args
其中 --args
是可选参数,用于指定提取的参数和配置。
3. 项目的配置文件介绍
项目的配置文件是 mimic_extract_env_py36.yml
。该文件定义了项目运行所需的环境配置,包括 Python 版本、依赖包等。
使用方法:
conda env create --force -f mimic_extract_env_py36.yml
conda activate mimic_data_extraction
以上命令将根据 mimic_extract_env_py36.yml
文件创建并激活一个新的 Conda 环境,确保项目所需的依赖包和 Python 版本正确安装。