本文仅仅是自己实现过程的笔记记录,仅仅用来交流的。
在网上大量搜集资料后,实现Mask-RCNN,但是过程中还是出现了很多很多的问题,所以将过程记录如下,方便日后学习。
一、实验前准备
1. COCO数据集
COCO的 全称是Common Objects in COntext,是微软团队提供的一个可以用来进行图像识别的数据集。MS COCO数据集中的图像分为训练、验证和测试集。
COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。
2. 环境搭建
本文采用github上Mask-RCNN代码,网址:https://github.com/matterport/Mask_RCNN
安装要求按照必要的环境
Python 3.6,TensorFlow 1.8-gpu,Keras 2.1.6(这些版本是我实验中的版本)和其他常见软件包requirements.txt。
二、制作数据集
这里我们需要利用labelme来生成json文件以及yaml文件等。
1. 安装labelme
win10+python3
在cmd中使用pip安装,
pip install pillow
pip install pyqt5
pip install labelme
安装成功之后,在python安装目录下Scripts目录下可以找到labelme,如下图所示: