文章目录
前言
前面有一篇文章主要讲述了如何本地训练yolo网络,略微提到了云端gpu训练,以此篇文章作为延续,详细讲述使用云端gpu训练神经网络模型,以训练nanodet网络模型为例;另外,对于yolo训练和目标检测的简易部署也会再更新一篇文章
nanodet仓库:nanodet
一、云端gpu选择
推荐多种,本文使用一种作为示例
1.云端gpu推荐
1.免费gpu
Kaggle和Colab需要科学上网
1.Kaggle
官网:Kaggle
每周43H使用时间
2.Colab
官网:Colab
单次运行12H
3.阿里云天池TCC V100
4.百度的AI Studio V100
2.租赁gpu
1.恒源云
官网:恒源云
2.AutoDL
官网:AutoDL
3.矿机
也是租赁gpu的一种,不过性能减半
官网:锯齿云
2.AutoDL租赁使用
进入AutoDL官网,注册登陆
进入算力市场,这里以租赁3090为例
查看nanodet仓库中对nanodet环境的要求
选择合适镜像
租用成功
二、vscode通过ssh连接云端gpu
也可以使用JupyteLab等
1.vscode插件
- 安装Remote Development插件
2.连接云端gpu
- 打开vscode的远程资源管理器
- 复制ssh还有密码
- 在vscode中粘贴,添加远程服务器
- 点击打开远程资源管理器
- 输入复制的密码连接上远程服务器
- 打开远程文件夹
三、部署nanodet训练环境
1.克隆nanodet仓库
- 打开远程终端,克隆仓库
# 此处使用了github加速通道
git clone https://github.91chi.fun/https://github.com/RangiLyu/nanodet.git
#
cd nanodet
2.根据nanodet仓库要求进行部署
# 选择了合适的镜像,所以可以直接运行后面的步骤
# Install requirements
pip install -r requirements.txt
# Setup NanoDet
python setup.py develop
- 部署完毕
四、训练开始
- 根据nanodet仓库中的How to Train进行设置