AutoDL云服务器运行yolov5

前言

因为课题需要,深度学习也接触了一段时间,但是由于没有条件,一直使用的笔记本进行学习,每次跑代码需要很久有一次跑了三天,什么都做不了,然后就尝试了解服务器,第一次使用服务器走了很多弯路,最后终于配置好了,就先记录下来,第一次写也希望能帮到大家。

一、租用服务器

当我们需要一个比较好的GPU而我们的预算又不足的时,可以租用一个服务器用来临时跑自己的深度学习模型。现在有很多服务器出租,看了好久决定选择Auto DL,价格对于贫穷的我来说还能接受,新用户注册还送10元代金券和1个月会员,可以更好的学习这个平台怎么用(开心哈哈哈),下来记录一下我是如何做的
(1)按照Auto DL要求,注册并登录:链接如下:
https://www.autodl.com/register?code=897c04bf-2598-427b-8987-058b3f39ebd2
(2)浏览帮助文档,了解如何使用(第一次接触,帮助文档有的也还是不理解为什么要这样)
a.点击快速开始会告诉我如何创建实例很详细,先选择一个合适的服务器,按照创建要求创建自己的实例。
在这里插入图片描述
例如:选择南京新手区,第一个TITAN XP 点击1卡可租进入后选择合适的主机,下拉选择想要的框架及版本,我选择的如下图所示,点击立即创建。 在这里插入图片描述
b.点击<我的实例>,可以查看租用的新实例。到此服务器租用完成。

二、上传数据

1.AutoDL上也有数据集但是我需要上传自己的数据集,利用xshell上传数据,Auto帮助文档介绍的很详细https://www.autodl.com/docs/xshell/
踩坑:上传自己的数据花了很长时间,按照帮助文档下载并安装Xshell 7和xftp 7,上传数据报错,说不是最新版本,查找了很多博客最终找到方法(https://blog.csdn.net/baidu_41614347/article/details/121951302)我选择最简单的一种,直接修改电脑日期到2016年,数据上传成功。
2.下载yolov5源码(2种方法)
a.可以在window上下载后通过上述方法利用Xshell进行上传
b.直接终端输入命令进行下载:git clone https://github.com/ultralytics/yolov5

三、配置yolov5环境

开机后,平台内置的镜像都安装了Miniconda,安装路径为/root/miniconda3/。里面已经默认安装了torch和python,但是我在使用时他告诉我版本不匹配,没有办法我重新建了虚拟环境,主要步骤如下:
1.新建名为my-env的虚拟环境,并且python版本3.7
conda create -n my-env python=3.7
2.进入虚拟环境:conda activate my-env
3.验证python是否安装成功:python
4.安装torch,我选择的如下,在链接里也可以查找自己需要的版本进行安装(https://pytorch.org/get-started/previous-versions/):conda install pytorch1.7.1 torchvision0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c pytorch
5.查看虚拟环境安装的包:conda list
6.安装yolov5依赖包(2种方法)
(1)终端输入命令(cd yolov5)进入yolov5文件夹,然后直接输入如下指令一键安装所需依赖包:
pip install -r requirements.txt
(2)打开requirements.txt查看虚拟环境需要哪个安装包,输入如下命令进行安装。
conda install 安装包的名字
踩坑:在安装opencv-python报错如下,可以换为命令pip install opencv-python:在这里插入图片描述

四、yolov5代码测试

终端输入命令:

cd yolov5
python detect.py --source data/images --weights yolov5s.pt --conf 0.25

在这里插入图片描述

五、yolov5训练

接下来就可以愉快的训练了:

python yolov5/train.py --data data/data.yaml --cfg yolov5/models/yolov5s.yaml --weights yolov5/yolov5s.pt --epochs 10 --batch-size 16

但是没想到又报错,换了torch版本也不对,最后根据路径按照提示找到activation.py的438行删掉self.inplace:
在这里插入图片描述
重新测试成功。
在这里插入图片描述

六、小结:

从刚开始租服务器到最后测试成功,中间遇到了很多问题,看了大神写的东西也试了不同的方法,怎么说呢这样也让自己更加熟悉这个过程,第一次写东西,写的不对的地方也希望大家指出来,互相交流一起进步。

  • 19
    点赞
  • 152
    收藏
    觉得还不错? 一键收藏
  • 26
    评论
如果您希望在租用的autodl服务器上运行yolov7,您可以按照以下步骤进行操作。 1. 首先,使用命令行进入服务器的工作目录。 2. 使用如下命令开始训练yolov7模型: ``` python train.py --cfg cfg/training/yolov7-FasterNet-new.yaml --name yolov7-FasterNet-new-from-yolov7-distillation --resume /root/autodl-tmp/yolov7-FasterNet-new-from-yolov7-distillation2/weights/last.pt ``` 这将启动训练过程,并根据提供的参数配置文件和预训练模型进行训练。 3. 如果您需要从另一个文件夹中复制训练文件夹到autodl-tmp中,并更改opt.yaml文件中的一些参数,可以使用以下命令: ``` cp -r /root/autodl-nas/NeimengA_runs/train/yolov7-FasterNet-new-from-yolov7-distillation2 /root/autodl-tmp ``` 这将复制整个训练文件夹,并将其粘贴到autodl-tmp文件夹中。然后,您可以编辑opt.yaml文件以更改项目和保存目录等参数,将它们指定到以/root/autodl-tmp开头的具体路径。 4. 如果您希望进行断点训练以避免OSError: [Errno 28] No space left on device错误,请确保将训练结果保存在autodl-tmp中,而不是autodl-nas中。您可以使用以下命令将现有的训练结果复制到autodl-tmp文件夹中: ``` cp -r dir1 dir2 ``` 这将复制dir1文件夹中的内容到dir2文件夹中。 请按照上述步骤操作,即可在租用的autodl服务器上运行yolov7模型。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Autodl服务器上训练YOLOv7改进代码时,突然中断并报错:OSError: [Errno 28] No space left on device](https://blog.csdn.net/LWD19981223/article/details/130740905)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 26
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值