开源项目 ML_SageMaker_Studies
使用教程
1. 项目的目录结构及介绍
ML_SageMaker_Studies/
├── README.md
├── requirements.txt
├── setup.py
├── data/
│ ├── raw/
│ └── processed/
├── notebooks/
│ ├── 01_data_exploration.ipynb
│ ├── 02_model_training.ipynb
│ └── 03_model_deployment.ipynb
├── src/
│ ├── __init__.py
│ ├── data_processing.py
│ ├── model_training.py
│ └── model_deployment.py
├── config/
│ ├── config.yaml
│ └── logging_config.yaml
└── tests/
├── test_data_processing.py
├── test_model_training.py
└── test_model_deployment.py
目录结构介绍
- README.md: 项目的基本介绍和使用说明。
- requirements.txt: 项目依赖的Python包列表。
- setup.py: 用于安装项目的Python脚本。
- data/: 存放数据文件的目录,包括原始数据和处理后的数据。
- notebooks/: Jupyter Notebook文件,用于数据探索、模型训练和模型部署。
- src/: 源代码目录,包含数据处理、模型训练和模型部署的Python脚本。
- config/: 配置文件目录,包含项目的配置文件和日志配置文件。
- tests/: 测试代码目录,包含各个模块的单元测试。
2. 项目的启动文件介绍
项目的启动文件主要位于 notebooks/
目录下,具体包括:
- 01_data_exploration.ipynb: 数据探索和预处理的Notebook。
- 02_model_training.ipynb: 模型训练的Notebook。
- 03_model_deployment.ipynb: 模型部署的Notebook。
这些Notebook文件是项目的核心启动文件,用户可以通过运行这些Notebook来完成数据处理、模型训练和模型部署的整个流程。
3. 项目的配置文件介绍
项目的配置文件主要位于 config/
目录下,具体包括:
- config.yaml: 项目的核心配置文件,包含数据路径、模型参数、训练参数等配置项。
- logging_config.yaml: 日志配置文件,定义了日志的输出格式、级别和存储路径。
用户可以通过修改这些配置文件来调整项目的运行参数,例如数据路径、模型超参数等。