win10+pytorch1.9+yolox模型训练

官方git:GitHub - Megvii-BaseDetection/YOLOX: YOLOX is a high-performance anchor-free YOLO, exceeding yolov3~v5 with MegEngine, ONNX, TensorRT, ncnn, and OpenVINO supported. Documentation: https://yolox.readthedocs.io/

主要步骤还是根据官方教程来,并记录一些坑。

1、首先下载yolox到本地,并安装所需环境,因为我的环境之前跑v5的时候基本符合所以这一步很快就结束了。

git clone git@github.com:Megvii-BaseDetection/YOLOX.git

cd YOLOX

pip3 install -U pip && pip3 install -r requirements.txt

pip3 install -v -e .  # or  python3 setup.py develop

2、下载安装apex,自己要是不想训练模型这一步可以跳过去

git clone https://github.com/NVIDIA/apex

cd apex

pip3 install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

在下载apex的过程中遇到无法下载的情况,不要慌将https改为git,就可以下载了。如下所示:

 

下载完成之后按照教程进行安装即可。

3、进行测试

测试之前我们需要从官方下载Benchmark,最好点击旁边github下载,下载完成之后将文件放到configs文件夹,这个文件夹是我自己创建的,大家也可以自己创建,输入以下命令:

python tools/demo.py image -n yolox-s -c configs/yolox_s.pth --path assets/dog.jpg --conf 0.25 --nms 0.45 --tsize 640 --save_result --device [gpu]

测试结果如下:嗯,,这是一幅很经典的图像了,这只狗永用的看着你

4、接下来可以训练自己的数据集了,yolox里面支持voc和coco数据集,这边我采用的是cooc数据集格式,因为之前跑其他模型得时候已经制作过coco数据集,这里就不介绍如何制作了,网上教程也很多,大家可以自行参考。

数据集主要存放在datssets文件夹下,如下:

打开coco_classes.py修改为自己标签,记住逗号不要忘记了,打开yolo_base.py修改epoch、num_work等参数

打开yolo_base.py将路径设置好。

修改之后输入已下命令:

python tools/train.py -n yolox-s -d 1 -b 1

这里d 是指gpu的数目,因为是在笔记本上运行,所以选择1

b是指batch size 按照官方教程来说计算方式为b=num-gpu * 8,但是为了防止给我报错 我还是选择了1

 小风扇呼啦呼啦的响,真担心会突然炸了,,,更担心突然给你报啥错误。。。。

训练结束:

 。。。。。best Ap 才59.29.。。。。。。。这。。。肯定哪个环节出错了。。。。。

 整个训练结束之后会得到一个模型:

 进行图像测试:

python tools/demo.py image -n yolox-s -c YOLOX_outputs/yolox_s/best_ckpt.pth --path datasets/COCO/images/zhachunling_1105_32.jpg --conf 0.25 --nms 0.45 --tsize 640 --save_result --device [gpu]

 最终结果会在一个以当前时间为名称的文件夹下:

 具体检测图像如下,因为我就一个标签pan,图上预测的概率是89.4%

至此,基于win10+pytorch1.9+yolox训练自己的数据集就算结束了,但总感觉哪里不对。。。。

中途出现的错误:
1、cuDNN error: CUDNN_STATUS_ALLOC_FAILED
关闭正在奔跑的其他模型或者关闭pycharm等多个可能使用cudnn的进程。因为我之前是跑了下yolov5检测下是否v5还能继续工作,但是我中途强行关闭了,后来进行了电脑重启这个问题就没了,应该是虽然关闭了但是还是占用了一些。
2、CUDA out of memory
这个问题应该是几乎所有人都会遇到的吧,没办法电脑就那配置,一方面按照网上说的疯狂的taskkill进程,删到最后我的笔记本还是不行,将bacth_size跳到1 特没用,,后来将训练命令行种得--fp16 -o去掉 ,不需要混合精度训练 ,之后就可以快乐的训练了。

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
Win10是Windows操作系统的最新版本,它具有更好的性能和用户体验。Anaconda是一个流行的Python发行版,它内置了许多科学计算和数据分析的库。PyTorch是一个深度学习框架,可以进行神经网络的设计和训练。 在Windows 10上安装Anaconda和PyTorch是非常简单的。首先,我们可以从Anaconda官网下载适用于Windows 10的安装文件。下载完成后,双击运行安装程序,并按照提示进行安装。安装过程中,我们可以选择安装Anaconda所需的库和工具。 安装完成后,我们可以打开Anaconda Navigator,这是一个可视化的管理界面,可以帮助我们轻松管理和使用各种Python包和环境。在Navigator中,我们可以创建新的Python环境,选择安装所需的包。 接下来,我们需要安装PyTorch。在Anaconda Navigator中,我们可以通过选择我们创建的Python环境,然后点击“Channels”选项卡,选择“conda-forge”通道。然后,在搜索框中输入“pytorch”,选择合适的版本进行安装。 等待安装完成后,我们就可以在Python环境中使用PyTorch进行深度学习的开发了。我们可以使用PyTorch构建神经网络模型,进行训练和预测。此外,Anaconda还提供了许多其他有用的库,如NumPy、Pandas和Matplotlib,这些库可以帮助我们进行数据处理和可视化。 总结来说,使用Win10操作系统安装并使用Anaconda和PyTorch是非常方便和简单的。通过Anaconda,我们可以快速配置Python环境,并方便地安装和管理所需的库和工具。而PyTorch则为我们提供了一个强大的深度学习框架,可以支持各种神经网络的设计和训练
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrs.Gril

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值