本文对在Windows系统下配置mmdetection环境并通过SWIN+MASK R-CNN网络对个人的VOC格式的数据集过程中遇到的问题进行总结,偏向于是对一些问题解答博客的汇总。
环境配置
环境配置我参考了下文博客: https://blog.csdn.net/CSDN_X_W/article/details
1.安装pytorch
使用annaconda安装,pytorch安装的版本是1.8.0,cuda安装的是11.1
需要注意:一定不要在半夜下载,因为会很慢,不管是镜像源还是官网的下载命令。
2.安装mmcv
因为mmdetection需要依赖于mmcv,所以需要先安装mmcv。mmcv要访问如下网址进行下载(cuda11.0+torch1.7.0的下载网址)
https://download.openmmlab.com/mmcv/dist/cu110/torch1.7.0/index.html
可以看到这清一色的linux,所以win用不了。看到有人说有些高版本的支持Windows了,所以下载了高版本的mmcv(cuda11.1+torch1.8.0)https://download.openmmlab.com/mmcv/dist/cu111/torch1.8.0/index.html
但是我下的win版本的mmcv最后没测试成功,所以就还是按照使用VS2019编译的方法进行了。大家可以尝试下载一下新版本的,可能是我操作有问题。
- 安装VS2019没什么问题,设置好环境变量就行了。
- mmcv下载好之后解压到annconda创建的新环境中
- Anaconda Powershell Prompt进入到 mmcv 目录下,执行
pip install -r requirements.txt
安装所需的包 - 配置环境变量:
- $env:TORCH_CUDA_ARCH_LIST=“8.6” // >3060显卡算力8.6
- $env:MMCV_WITH_OPS = 1
- $env:MAX_JOBS = 8 根据CPU核心数设置
- 运行:
python setup.py build_ext
(这步包括下面的一步就会用到之前VS中的cl工具) - 运行:
python setup.py develop
- 验证:codna list 会看到 mmcv-full
- 正常流程如上,但是我在执行
python setup.py build_ext
的时候报错了,报错信息为:
fatal error LNK1181: 无法打开输入文件“...\mmcv_1.3.17\build\temp.win-amd64-cpython-38\Release\.\mmcv\ops\csrc\pytorch\cuda\assign_score_withk_cuda.obj
也就是VS没有编译成功,这个问题困扰了好久。后来关机后,第二天起来就成功了,可能安装完VS配置好环境变量后没有重启的原因?
3.安装mmdetection以及apex
第二步成功后,直接按照上面博客进行操作即可安装成功,最终mmdet被更新到了2.11.0版本。
4.下载权重并进行测试
测试代码:python demo/image_demo.py demo/demo.jpg configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py mask_rcnn_swin_tiny_patch4_window7.pth
写的代码是那种需要传参的类型的,每次都要终端执行语句,应该可以在传参函数处把default值改成需要的值
结果如下图:
训练个人VOC数据集
下面这篇博客介绍了训练个人数据集需要修改的相关操作
https://blog.csdn.net/CSDN_X_W/article/details/123664693?spm=1001.2014.3001.5502
但是他讲的是COCO数据集,VOC数据集的话有一个分割的文件夹,因为MASK R-CNN的也是进行实例分割,所以VOC是十分适合这个网络的。但是!如果我们自己的VOC数据集没有分割的那部分,用MASK训练会报错。所以需要把MASK操作给屏蔽掉,具体步骤参考下方博客:
https://blog.csdn.net/qq_36622589/article/details/124355564
如果没有屏蔽会报错:TypeError: 'NoneType' object is not iterable
训练过程中很慢,建议多GPU训练,不然真的会很慢。一直出现损失为Nan的情况,不知道是不是因为屏蔽了MASK的原因啊,很烦…