Mask-Rcnn 数据制作最详细教程（labelme版）

Jokers-Y

已于 2023-08-10 14:19:53 修改

阅读量7.7k

点赞数 19

分类专栏：图像处理文章标签：计算机视觉

于 2019-09-11 11:39:18 首次发布

本文链接：https://blog.csdn.net/qq_26850561/article/details/100728042

版权

图像处理专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Mask-Rcnn数据制作最详细教程（labelme版）

摘要
1.数据集制作
- 1. labelme的安装及使用
- 2.标注图片及批量转换

摘要

你好！本文将从数据标注开始，详解每一步直至成功制作自己的Mask-Rcnn数据集。

1.数据集制作

本文选择labelme软件进行数据集的标注工作，labelme下载链接如下：
链接: link.

1. labelme的安装及使用

labelme的安装及使用很简单，可参考下面的链接：
链接: link.

2.标注图片及批量转换

标注好的每个数据会有一个对应的json文件，如下图所示
在这里插入图片描述
Mask-Rcnn训练集需要的文件就由上面的json文件转换得到，首先找到你的labelme安装路径，例如我是在Anaconda中安装的，那么我的操作路径就是C:\PersonalApp\Anaconda3\Scripts，该路径根据个人实际情况进行修改，键盘输入win+r，进入运行，输入cmd后点击回车进入命令行模式，如下图所示：
在这里插入图片描述

此时输入cd C:\PersonalApp\Anaconda3\Scripts，进入该文件夹，需要用到该文件夹中的labelme_json_to_dataset.exe文件，在命令行输入labelme_json_to_dataset <文件名>.json，即可生成所需的五个文件，如下图所示：

生成的这五个文件中最重要的就是其中的labelme.png文件，很多Mask-Rcnn的文章都将其转为8位深度图片，但是注意当前版本的labelme生成的label.png本身就是8位的，不需要转换，这是数据制作中最重要的一步，一定注意，图片深度可鼠标右键查看属性的详细信息，如下图所示：在这里插入图片描述
上述命令行可以转换一张图片和相应的json文件，但是我们在制作训练集时，逐张转换实在过于繁琐，本文使用一种批量转换json文件的方法。首先找到安装路径的Lib文件夹，如我的就是C:\PersonalApp\Anaconda3，进入其中的site-packages文件夹，找到其中的labelme文件夹，进入cli文件夹找到json_to_dataset.py文件，修改该文件为：
（其中路径改为自己的json文件路径）

// json_to_dataset.py
import argparse
import base64
import json
import os
import os.path as osp
import warnings

import PIL.Image
import yaml

from labelme import utils
###############################################增加的语句,改下路径即可##############################
import glob
json_list = glob.glob(os.path.join('C://UsersDesktop//1','*.json'))
###############################################   end    ##################################


def main():
    # warnings.warn("This script is aimed to demonstrate how to convert the\n"
    #               "JSON file to a single image dataset, and not to handle\n"
    #               "multiple JSON files to generate a real-use dataset.")

    parser = argparse.ArgumentParser()
    ###############################################  删除的语句  ##################################
    # parser.add_argument('json_file')
    # json_file = args.json_file
    ###############################################    end       ##################################
    parser.add_argument('-o', '--out', default=None)
    args = parser.parse_args()

    ###############################################增加的语句##################################
    for json_file in json_list:
    ###############################################    end       ##################################

        if args.out is None:
            out_dir = osp.basename(json_file).replace('.', '_')
            out_dir = osp.join(osp.dirname(json_file), out_dir)
        else:
            out_dir = args.out
        if not osp.exists(out_dir):
            os.mkdir(out_dir)

        data = json.load(open(json_file))

        if data['imageData']:
            imageData = data['imageData']
        else:
            imagePath = os.path.join(os.path.dirname(json_file), data['imagePath'])
            with open(imagePath, 'rb') as f:
                imageData = f.read()
                imageData = base64.b64encode(imageData).decode('utf-8')
        img = utils.img_b64_to_arr(imageData)

        label_name_to_value = {'_background_': 0}
        for shape in data['shapes']:
            label_name = shape['label']
            if label_name in label_name_to_value:
                label_value = label_name_to_value[label_name]
            else:
                label_value = len(label_name_to_value)
                label_name_to_value[label_name] = label_value
        # lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)
        #
        # label_names = [None] * (max(label_name_to_value.values()) + 1)
        # for name, value in label_name_to_value.items():
        #     label_names[value] = name
        # lbl_viz = utils.draw_label(lbl, img, label_names)
                # label_values must be dense
        label_values, label_names = [], []
        for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):
            label_values.append(lv)
            label_names.append(ln)
        assert label_values == list(range(len(label_values)))

        lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)

        captions = ['{}: {}'.format(lv, ln)
                    for ln, lv in label_name_to_value.items()]
        lbl_viz = utils.draw_label(lbl, img, captions)

        PIL.Image.fromarray(img).save(osp.join(out_dir, 'img.png'))
        utils.lblsave(osp.join(out_dir, 'label.png'), lbl)
        PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, 'label_viz.png'))

        with open(osp.join(out_dir, 'label_names.txt'), 'w') as f:
            for lbl_name in label_names:
                f.write(lbl_name + '\n')

        warnings.warn('info.yaml is being replaced by label_names.txt')
        info = dict(label_names=label_names)
        with open(osp.join(out_dir, 'info.yaml'), 'w') as f:
            yaml.safe_dump(info, f, default_flow_style=False)

        print('Saved to: %s' % out_dir)


if __name__ == '__main__':
    main()

当然，也可以直接下载后替换即可（其中路径改为自己的json文件路径），连接如下：
链接: link.
替换后打开json_to_dataset.py文件，直接执行即可，相应文件夹会批量转换，如下图所示：
在这里插入图片描述
至此，Mask-Rcnn数据制作基本完成，后面只需要将转换后的文件分配到相应文件夹即可。若代码可用请点颗星星，谢谢

Jokers-Y

关注

19
点赞
踩
45

收藏

觉得还不错? 一键收藏
4
评论
Mask-Rcnn 数据制作最详细教程（labelme版）

Mask-Rcnn实践最详细教程摘要1.数据集制作1. labelme的安装及使用2.标注图片及批量转换功能快捷键Mask-Rcnn实践最详细教程如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowc...
复制链接

扫一扫