AutoDL云服务器运行yolov5

m0_46086544

已于 2022-07-22 15:09:17 修改

阅读量1.2w

点赞数 19

分类专栏：笔记文章标签：深度学习

于 2022-04-21 22:58:10 首次发布

本文链接：https://blog.csdn.net/m0_46086544/article/details/123898024

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章目录

前言
一、租用服务器
二、上传数据
三、配置yolov5环境
四、yolov5代码测试
五、yolov5训练
六、小结：

前言

因为课题需要，深度学习也接触了一段时间，但是由于没有条件，一直使用的笔记本进行学习，每次跑代码需要很久有一次跑了三天，什么都做不了，然后就尝试了解服务器，第一次使用服务器走了很多弯路，最后终于配置好了，就先记录下来，第一次写也希望能帮到大家。

一、租用服务器

当我们需要一个比较好的GPU而我们的预算又不足的时，可以租用一个服务器用来临时跑自己的深度学习模型。现在有很多服务器出租，看了好久决定选择Auto DL，价格对于贫穷的我来说还能接受，新用户注册还送10元代金券和1个月会员，可以更好的学习这个平台怎么用（开心哈哈哈),下来记录一下我是如何做的
（1）按照Auto DL要求,注册并登录：链接如下：
https://www.autodl.com/register?code=897c04bf-2598-427b-8987-058b3f39ebd2
（2）浏览帮助文档，了解如何使用（第一次接触，帮助文档有的也还是不理解为什么要这样）
a.点击快速开始会告诉我如何创建实例很详细，先选择一个合适的服务器，按照创建要求创建自己的实例。
在这里插入图片描述
例如：选择南京新手区，第一个TITAN XP 点击1卡可租进入后选择合适的主机，下拉选择想要的框架及版本，我选择的如下图所示，点击立即创建。
b.点击<我的实例>，可以查看租用的新实例。到此服务器租用完成。

二、上传数据

1.AutoDL上也有数据集但是我需要上传自己的数据集，利用xshell上传数据，Auto帮助文档介绍的很详细https://www.autodl.com/docs/xshell/
踩坑：上传自己的数据花了很长时间，按照帮助文档下载并安装Xshell 7和xftp 7，上传数据报错，说不是最新版本，查找了很多博客最终找到方法（https://blog.csdn.net/baidu_41614347/article/details/121951302）我选择最简单的一种，直接修改电脑日期到2016年，数据上传成功。
2.下载yolov5源码（2种方法）
a.可以在window上下载后通过上述方法利用Xshell进行上传
b.直接终端输入命令进行下载：git clone https://github.com/ultralytics/yolov5

三、配置yolov5环境

开机后，平台内置的镜像都安装了Miniconda，安装路径为/root/miniconda3/。里面已经默认安装了torch和python，但是我在使用时他告诉我版本不匹配，没有办法我重新建了虚拟环境，主要步骤如下：
1.新建名为my-env的虚拟环境，并且python版本3.7
conda create -n my-env python=3.7
2.进入虚拟环境：conda activate my-env
3.验证python是否安装成功：python
4.安装torch，我选择的如下，在链接里也可以查找自己需要的版本进行安装（https://pytorch.org/get-started/previous-versions/）：conda install pytorch1.7.1 torchvision0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c pytorch
5.查看虚拟环境安装的包：conda list
6.安装yolov5依赖包（2种方法）
（1）终端输入命令（cd yolov5）进入yolov5文件夹，然后直接输入如下指令一键安装所需依赖包：
pip install -r requirements.txt
（2）打开requirements.txt查看虚拟环境需要哪个安装包，输入如下命令进行安装。
conda install 安装包的名字
踩坑：在安装opencv-python报错如下，可以换为命令pip install opencv-python：在这里插入图片描述

四、yolov5代码测试

终端输入命令：

cd yolov5
python detect.py --source data/images --weights yolov5s.pt --conf 0.25

在这里插入图片描述

五、yolov5训练

接下来就可以愉快的训练了：

python yolov5/train.py --data data/data.yaml --cfg yolov5/models/yolov5s.yaml --weights yolov5/yolov5s.pt --epochs 10 --batch-size 16

但是没想到又报错，换了torch版本也不对，最后根据路径按照提示找到activation.py的438行删掉self.inplace：
在这里插入图片描述
重新测试成功。

六、小结：

从刚开始租服务器到最后测试成功，中间遇到了很多问题，看了大神写的东西也试了不同的方法，怎么说呢这样也让自己更加熟悉这个过程，第一次写东西，写的不对的地方也希望大家指出来，互相交流一起进步。

m0_46086544

关注

19
点赞
踩
153

收藏

觉得还不错? 一键收藏
26
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录