Mask_RCNN训练自己的数据，标注工具Labelme的使用说明

任博啥时候能毕业？

已于 2022-08-09 23:42:29 修改

阅读量2.9w

点赞数 9

分类专栏：深度学习文章标签： mask_rcnn labelme tensorflow keras json

于 2018-04-07 13:21:57 首次发布

本文链接：https://blog.csdn.net/qq_15969343/article/details/79840517

版权

深度学习专栏收录该内容

48 篇文章 9 订阅

订阅专栏

⚡插播一条老家自产的糖心苹果，多个品种，欢迎选购！有问题随时私信我⚡：

🍎🍎来自雪域高原的馈赠——海拔2000米的大凉山高原生态糖心苹果🍎🍎https://blog.csdn.net/qq_15969343/article/details/126107252

#2018/07/03 更新

制作好训练集之后，如何进行训练？戳这里：

Mask_RCNN训练自己的数据https://blog.csdn.net/qq_15969343/article/details/80893844

#2018/06/29 更新

这个版本的Mask_rcnn精度和速度都没有FAIR的detectron好，同一个数据集，detectron要高出至少20%的精度，而且由于框架的特性，detectron速度也要快得多~~要不要了解一下如何把自己的数据转换为detectron所需的coco格式？需要的同学点这里：

Detectron：训练自己的数据集——将自己的数据格式转换成COCO格式_Jayce~的博客-CSDN博客_数据集转为coco格式https://blog.csdn.net/qq_15969343/article/details/80848175

#2018/06/04 更新

使用官方的权重只检测特定的类别看这里：

Mask_RCNN：使用COCO权重进行特定类别预测（只标记出你需要的类别）https://blog.csdn.net/qq_15969343/article/details/80568579

#2018/05/22 更新

使用训练好的Mask_RCNN模型进行预测看这里：

Mask_RCNN：使用自己训练好的模型进行预测https://blog.csdn.net/qq_15969343/article/details/80388311

#2018/05/04 更新

由于labelme的数据预处理过程还是太繁琐，现在换成了类似于COCO数据集注释的方式（JSON文件）：

Mask_RCNN训练自己的数据，制作类似于COCO数据集中所需要的Json注释https://blog.csdn.net/qq_15969343/article/details/80167215

#以下为原文

该Mask_RCNN版本为基于：Python3，Keras，TensorFlow，我使用的具体版本为：

Python 3.6.3
TensorFlow 1.7
Keras 2.1.5
PyQt5 5.9.2
Labelme 2.8.0

Mask_RCNN来自matterport，地址为：

点击打开链接https://github.com/matterport/Mask_RCNN

使用的标记工具为Labelme,地址如下：

点击打开链接https://github.com/wkentaro/labelme

安装完Labelme之后，直接在CMD窗口输入labelme,即可打开：

点击view下面的高级模式，可以控制图像显示的大小：

点击Create_Polygon在图像上标记需要的东西，并命名：

保存该标注，可以得到一个.json文件，该文件包含了图像文件本身以及标注的对象框，打开该文件，可以看到其中包含的内容：

如何打开json可以查看我的这篇博客：

格式化打开JSON数据以及Notepad++没有插件管理器(Plugin Manager)的解决方法_Jayce~的博客-CSDN博客https://blog.csdn.net/qq_15969343/article/details/79817354

该json需要转换为训练程序需要的Mask数据，此时在CMD窗口输入以下指令（以刚才生成的json示例，你只需要把路径转换为json文件所在的路径）即可转换：

labelme_json_to_dataset C:\Users\Administrator\Desktop\8433365521_9252889f9a_z.json

此时可以得到以json文件名而命名的一个文件夹，打开该文件夹，可以看到里面包含了五个文件：

img.png(原图);

info.yaml;

label.png;

label_names.txt;

label_viz.png

可以看到本来标记的只有两类，但是打开标签可视化文件，可以看到自动加了背景，所以是1+2=3类,打开label_viz.png可见：

但是在训练的时候肯定是多个数据，不可能一个一个的挨着转换，所以肯定要批转换这些json:

linux下，使用如下命令：

str1="json路径"
str2=".json"
for((i=1;i<图片数量;i++))
do 
str3=${i}
labelme_json_to_dataset ${str1}${str3}${str2}
done

windows下，使用如下命令：

for /r 路径 %i in (*.json) do labelme_json_to_dataset %i

而转换后的label.png是其中非常重要的掩码文件，打开却是一片黑，这是什么情况？出BUG了？

其实，这是因为labelme将类别的像素值从1开始赋值，比如刚才的3类分别赋值0，1，2，因为值都很小，因此看着都是黑的；将图片使用matlab读入可以看到如上面所述：

我们可以将这些掩膜的像素值做一个映射（如像素值分别乘以100，当前的像素值则有（0,1,2）变为（0,100,200）），从而可以清楚的看到：

而从上面matlab的截图，可以清楚看到掩码标签为16位存储，我们需要将16位转8位，关于16位转8位，请关注我的另外一篇博客：

点击打开链接https://blog.csdn.net/qq_15969343/article/details/79841446

都看到这里了，还不赶紧点赞，评论，收藏走一波？

任博啥时候能毕业？

关注

9
点赞
踩
78

收藏

觉得还不错? 一键收藏
打赏
36
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录