参考资料:
- 官方文档
- DVC 使用手册
1. 前言
在做机器学习相关项目的时候常常遇到数据或模型过大而无法上传至 Github , Gitlab 的情况。这个时候 DVC 就可以帮我们解决这一问题,DVC
(Data Version Control)) 是一种利用现有工程工具集(Git、CI/CD 等)来实现数据和机器学习实验管理工具,DVC 的存在使 ML 模型可共享且可复现。它旨在处理大型文件、数据集、机器学习模型、指标和代码。
2.1 安装
pip install dvc
2.2 配置
本地仓库初始化
git init
dvc init
与远程仓库建立连接
git remote add or