上方是GitHub上源码链接。因为有很多bash命令,我在windiows上安装了ubuntu用于制行linux命令,我使用给出的bash命令下载了VOC数据集以及预训练的caffemodels模型。
使用conda来创建环境以及安装依赖项时,遇到了pip版本不匹配,无法安装opendcv库的问题,总是失败,于是我先安装部分依赖项,然后部分安装失败的库,手动安装,注意opencv库与python版本有严格对应的关系,必须找到适用于python3.6版本的cv库才可以安装,建议使用pip安装时,除了更新pip到最新版本以外,还要使用pip指定版本来安装,换上清华源或者阿里源也行。
环境安装好之后,就是数据集的问题,voc数据集由上方命令给出可以下载,SBD(增强数据集)GitHub上给的地址无法使用,我找到了这个开源在飞浆上的一个压缩包
https://aistudio.baidu.com/datasetdetail/65497
点进去注册百度账号就能下载了。
里面分成cls 以及img
共11701个实例。
我的做法是把cls直接复制到SegmentationClassAug这个文件夹上,
我的建议是阅读GitHub上每个文件夹下面有的readme.md,这个说明里面还有个下载地址
https://github.com/kazuto1011/deeplab-pytorch/files/2945588/list.zip
下载地址里面得到的压缩包,里面就是segmentationAug文件夹下面的所有txt文件,阅读txt后发现训练集于测试集都是用了一万多张图片,所以我推测应该是直接把cls下面的所有图片复制到Aug文件夹下。img文件夹不用管,
JPEGImages里面有一万七千多张图片,包含了img中有的图片。
segmentationAug 以及SegmentationClassAug这两个文件夹都是自己创建的然后找到SBD数据再添加上去的。
【目标检测数据集】VOC2012 数据集与 SBD dataset 介绍 (qq.com)
这篇文件介绍了数据集,看完就发现他写的sbd数据集里面图片实例数字与我找到的数据有点出入。
不过我感觉应该可以了,而且他的要花钱。
这个数据集下载完了,再改一下yaml中的root路径。
运行继续找错误吧。。。