fast-maskrcnn是在像素级别上检测掩膜的。
本文采用https://github.com/CharlesShang/FastMaskRCNN的代码,基于tensorflow-GPU的深度学习的环境。
首先复制代码:
git clone https://github.com/CharlesShang/FastMaskRCNN
下载COCO数据集,这个代码用的2014的数据集,官方如果太慢的话,可以采用https://www.aiuai.cn/aifarm931.html的国内地址。下载完成后分别解压,生成文件目录如图:
其中annotations、train2014、val2014是解压出来的,records是后边生成的,后文会讲。
下载预训练模型,这里采用resnet50
wget http://download.tensorflow.org/models/resnet_v1_50_2016_08_28.tar.gz
解压到data下的pretrained_models文件夹下
接下来对libs进行编译,进入libs文件夹下,运行make,如果环境是python3需要将libs下的setup.py中的84行改为
print(extra_postargs)
50行改为:
for k, v in cudaconfig.items():
如果在ubuntu系统下报错,很有可能是编码格式的问题,具体查看哪个文件(filename)报错,对哪个文件执行格式的转化
安装: apt-get install dos2unix
命令: dos2unix filename
接下来回到主目录,运行download_and_convert_data.py,会在records生成一系列文件。
静等程序运行完毕后就可以开始进行训练,测试了。