【SWIN-Transformer环境配置及个人VOC数据集的训练】

最新推荐文章于 2024-05-09 17:21:04 发布

大白菜菜籽

最新推荐文章于 2024-05-09 17:21:04 发布

阅读量1.6k

点赞数

分类专栏：目标检测文章标签： transformer 深度学习人工智能

本文链接：https://blog.csdn.net/weixin_42686221/article/details/125471588

版权

目标检测专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文对在Windows系统下配置mmdetection环境并通过SWIN+MASK R-CNN网络对个人的VOC格式的数据集过程中遇到的问题进行总结，偏向于是对一些问题解答博客的汇总。

环境配置

环境配置我参考了下文博客: https://blog.csdn.net/CSDN_X_W/article/details

1.安装pytorch

使用annaconda安装，pytorch安装的版本是1.8.0，cuda安装的是11.1
需要注意：一定不要在半夜下载，因为会很慢，不管是镜像源还是官网的下载命令。

2.安装mmcv

因为mmdetection需要依赖于mmcv，所以需要先安装mmcv。mmcv要访问如下网址进行下载(cuda11.0+torch1.7.0的下载网址)
https://download.openmmlab.com/mmcv/dist/cu110/torch1.7.0/index.html
在这里插入图片描述

可以看到这清一色的linux，所以win用不了。看到有人说有些高版本的支持Windows了，所以下载了高版本的mmcv（cuda11.1+torch1.8.0）https://download.openmmlab.com/mmcv/dist/cu111/torch1.8.0/index.html
在这里插入图片描述
但是我下的win版本的mmcv最后没测试成功，所以就还是按照使用VS2019编译的方法进行了。大家可以尝试下载一下新版本的，可能是我操作有问题。

安装VS2019没什么问题，设置好环境变量就行了。
mmcv下载好之后解压到annconda创建的新环境中
Anaconda Powershell Prompt进入到 mmcv 目录下，执行 pip install -r requirements.txt安装所需的包
配置环境变量：
- $env:TORCH_CUDA_ARCH_LIST=“8.6” // >3060显卡算力8.6
- $env:MMCV_WITH_OPS = 1
- $env:MAX_JOBS = 8 根据CPU核心数设置
运行：python setup.py build_ext（这步包括下面的一步就会用到之前VS中的cl工具）
运行：python setup.py develop
验证：codna list 会看到 mmcv-full
正常流程如上，但是我在执行python setup.py build_ext的时候报错了，报错信息为：

 fatal error LNK1181: 无法打开输入文件“...\mmcv_1.3.17\build\temp.win-amd64-cpython-38\Release\.\mmcv\ops\csrc\pytorch\cuda\assign_score_withk_cuda.obj

也就是VS没有编译成功，这个问题困扰了好久。后来关机后，第二天起来就成功了，可能安装完VS配置好环境变量后没有重启的原因？

3.安装mmdetection以及apex

第二步成功后，直接按照上面博客进行操作即可安装成功，最终mmdet被更新到了2.11.0版本。

4.下载权重并进行测试

测试代码：python demo/image_demo.py demo/demo.jpg configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py mask_rcnn_swin_tiny_patch4_window7.pth

写的代码是那种需要传参的类型的，每次都要终端执行语句，应该可以在传参函数处把default值改成需要的值

结果如下图：
在这里插入图片描述

训练个人VOC数据集

下面这篇博客介绍了训练个人数据集需要修改的相关操作
https://blog.csdn.net/CSDN_X_W/article/details/123664693?spm=1001.2014.3001.5502
但是他讲的是COCO数据集，VOC数据集的话有一个分割的文件夹，因为MASK R-CNN的也是进行实例分割，所以VOC是十分适合这个网络的。但是！如果我们自己的VOC数据集没有分割的那部分，用MASK训练会报错。所以需要把MASK操作给屏蔽掉，具体步骤参考下方博客：
https://blog.csdn.net/qq_36622589/article/details/124355564
如果没有屏蔽会报错：TypeError: 'NoneType' object is not iterable
训练过程中很慢，建议多GPU训练，不然真的会很慢。一直出现损失为Nan的情况，不知道是不是因为屏蔽了MASK的原因啊，很烦…

大白菜菜籽

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【SWIN-Transformer环境配置及个人VOC数据集的训练】

本文对在Windows系统下配置mmdetection环境并通过SWIN+MASK R-CNN网络对个人的VOC格式的数据集过程中遇到的问题进行总结，偏向于是对一些问题解答博客的汇总。环境配置我参考了下文博客: https://blog.csdn.net/CSDN_X_W/article/details 使用annaconda安装，pytorch安装的版本是1.8.0，cuda安装的是11.1...
复制链接

扫一扫