部署YOLOV5环境到服务器进行多GPU训练

最新推荐文章于 2024-08-09 18:33:22 发布

蚂蚁资源

最新推荐文章于 2024-08-09 18:33:22 发布

阅读量1.2k

点赞数 1

分类专栏： yolov5 人工智能 python 文章标签： YOLO python pytorch 机器学习目标检测

本文链接：https://blog.csdn.net/CSDN1621564706/article/details/131136329

版权

yolov5 同时被 3 个专栏收录

5 篇文章 1 订阅

订阅专栏

python

5 篇文章 0 订阅

订阅专栏

人工智能

4 篇文章 4 订阅

订阅专栏

该文指导如何部署YOLOV5模型到GPU服务器，包括通过VSCode远程连接，安装PyTorch环境，调整代码以适应多GPU训练，以及注意的训练参数设置。

摘要由CSDN通过智能技术生成

部署YOLOV5环境到服务器进行多GPU训练

访问官网进行注册并登录

点我访问AutoDl官网

购买一台GPU服务器：

在这里插入图片描述

通过vscode链接GPU服务器：

安装插件

在这里插入图片描述

配置连接信息

在这里插入图片描述

安装服务器中的YOLOV5-GPU环境

到torch官网：

点我访问torch官网
在这里插入图片描述

复制命令到终端，安装pytorch,记得把pip3改为pip

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

在这里插入图片描述

最后等待安装完成即可

复制自己本机跑通的YOLOV5代码到服务器

在这里插入图片描述

注释这里我们通过vscode进行上传文件，也可以通过其他方式进行上传

先解压文件

在这里插入图片描述

进入yolov5-7.0文件夹根目录将tqdm>=4.64.0改为tqdm>=4.63.1输入以下命令：

pip install -r requirements.txt

在服务器中安装python扩展

在这里插入图片描述

重连服务器，重新打开目录yolov5目录准备训练

在这里插入图片描述

如果出现Downloading https://ultralytics.com/assets/Arial.ttf to /root/.config/Ultralytics/Arial.ttf…：

多等一会或者多运行几次即可，实在不行可以手动在本地找到这个字体文件复制到服务器中的/root/.config/Ultralytics/目录下

因为代码我们在本地已经跑通了，所以直接运行train.py即可进行默认单GPU训练：

在这里插入图片描述

如果你需要进行多GPU训练，可以参考以下步骤，前提是你真的买了两个GPU哦：

在这里插入图片描述

既然是多GPU就要合理调试batch-size中的值，可以适当微调，观察显卡显存，如果显存没满可以持续增加batch-size，默认训练epochs的值是100，如果你数据足够多，可以搞500epochs，当然了多GPU训练请先确保你的数据有5000-30000数据再使用。

好了本期教学分享到这里

蚂蚁资源

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录