Cookiecutter Data Science 项目教程

最新推荐文章于 2024-10-08 15:44:07 发布

韦韬韧Hope

最新推荐文章于 2024-10-08 15:44:07 发布

阅读量338

点赞数 3

本文链接：https://blog.csdn.net/gitblog_00582/article/details/142246743

版权

Cookiecutter Data Science 项目教程

cookiecutter-data-science A logical, reasonably standardized, but flexible project structure for doing and sharing data science work. 项目地址: https://gitcode.com/gh_mirrors/co/cookiecutter-data-science

1. 项目的目录结构及介绍

Cookiecutter Data Science (CCDS) 项目提供了一个逻辑上合理、标准化且灵活的项目结构，用于进行和分享数据科学工作。以下是项目的主要目录结构及其介绍：

├── LICENSE          <- 项目使用的开源许可证（如果选择了开源许可证）
├── Makefile         <- 包含方便命令的 Makefile，例如 `make data` 或 `make train`
├── README.md        <- 项目顶层的 README 文件，供开发者使用
├── data
│   ├── external     <- 来自第三方源的数据
│   ├── interim      <- 经过转换的中间数据
│   ├── processed    <- 用于建模的最终规范数据集
│   └── raw          <- 原始的、不可变的数据
├── docs             <- 默认的 mkdocs 项目，详情请参见 www.mkdocs.org
├── models           <- 训练好的模型、模型预测或模型摘要
├── notebooks        <- Jupyter 笔记本，命名约定为数字（用于排序）、创建者首字母和简短描述，例如 `1.0-jqp-initial-data-exploration`
├── pyproject.toml   <- 项目配置文件，包含包元数据和工具配置（如 black）
├── references       <- 数据字典、手册和其他解释性材料
├── reports          <- 生成的分析报告，格式为 HTML、PDF、LaTeX 等
└── figures          <- 生成的图形和图表，用于报告
├── requirements.txt <- 用于重现分析环境的依赖文件，例如 `pip freeze > requirements.txt`
├── setup.cfg        <- flake8 的配置文件
└── [[ cookiecutter.module_name ]] <- 项目源代码
    ├── __init__.py  <- 使 [[ cookiecutter.module_name ]] 成为一个 Python 模块
    ├── config.py    <- 存储有用的变量和配置
    ├── dataset.py   <- 用于下载或生成数据的脚本
    ├── features.py  <- 用于创建建模特征的代码
    ├── modeling
    │   ├── __init__.py
    │   ├── predict.py <- 使用训练好的模型进行推理的代码
    │   └── train.py   <- 用于训练模型的代码
    └── plots.py     <- 用于创建可视化的代码