1.1【Mask-RCNN训练自己的数据集】---- Part One:制作数据集(全部流程总结+部分释义)

写在前面

该实现基于Tensorflow、Keras框架,在Ubuntu16.04下运行。

官方github MaskRCNN demo

一.制作数据集

1.1 下载安装Labelme

Labelme用来制作图像分割数据集,在安装Labelme之前需要安装下载其所需要的一些依赖库,具体的安装方式见这篇博客
Labelme安装
Labelme github链接
由于笔者之前已经安装过所需要的依赖库,所以在ubuntu终端下直接运行pip install labelme即可,这里就不在赘述。
启动Labelme

labelme

1.2 标注数据集

  • 在正式标注数据集之前最好对自己的数据集进行一定的处理。样本量如果太小则需进行数据增强,其次在制作数据集时需要考虑所训练网络对input image的需求,就MaskRcnn而言需要保证输入图片是square。官方解释
    (在阅读部分博客时有的博主说输入图片需要保证是64的倍数,这个笔者暂时还无法给出确定的答案,有待求证。欢迎有明白的博友们留言,不胜感激。)本次训练笔者所使用的数据resize为960*960。
  • 接下来就是漫长的手动标注数据的工作了,需要提醒的是,在标注数据集时, 倘若你的一张照片当中包含有多个同类物体,在标注时需要对其进行编号。 以标注apple为例,倘若image中只有一个apple,仅许对其打上apple的标签即可,倘若image中有三个apple,则需要分别打上apple1, apple2, apple3的标签。
  • labelme标注数据集之后会在所保存的文件路径下生成一系列的json文件,这些json文件无法直接送入网络进行训练,需要对其进行一定的转换,Labelme提供了一定的脚本可以对json文件进行转换。
labelme_json_to_dataset  ***.json #***表示文件名

该脚本位于"/usr/local/lib/python3.5/dist-packages/labelme/cli/"

转换之后会得到***_json这样一个文件夹,文件夹下存放有下述文件。
在这里插入图片描述
后续要用到的主要有label.png 和 info.yaml文件
(温馨提示:打开某个yaml文件查看一下其格式是否正确,正确格式如下:)

label_names:
- _background_
- apple

原始labelme_json_to_dataset脚本只能对单个json文件进行转换,比较繁琐,so,修改脚本文件使其可以进行批量转换

  • json_to_dataset.py 批量转换json文件
# -*- coding: utf-8 -*-
import argparse
import json
import os
import os.path as osp
import warnings
 
import imgviz 
import PIL.Image
import yaml
 
from labelme.logger import logger
from labelme import utils
import base64

def main():
    # warnings.warn("This script is aimed to demonstrate how to convert the\n"
    #               "JSON file to a single image dataset, and not to handle\n"
    #               "multiple JSON files to generate a real-use dataset.")
    parser = argparse.ArgumentParser()
    parser.add_argument('json_file')
    parser.add_argument('-o', '--out', default=None)
    args = parser.parse_args()
 
    json_file = args.json_file
    if args.out is None:
        out_dir = osp.basename(json_file).replace('.', '_')
        out_dir = osp.join(osp.dirname(json_file), out_dir)
    else:
        out_dir = args.out
    if not osp.exists(out_dir):
        os.mkdir(out_dir)
 
    count = os.listdir(json_file) 
    for i in range(0, len(count)):
        path = os.path.join(json_file, count[i])
        if os.path.isfile(path):
            data = json.load(open(path))
            
            if data['imageData']:
                imageData = data['imageData']
            else:
                imagePath = os.path.join(os.path.dirname(path), data['imagePath'])
                with open(imagePath, 'rb') as f:
                    imageData = f.read()
                    imageData = base64.b64encode(imageData).decode('utf-8')
            img = utils.img_b64_to_arr(imageData)
            label_name_to_value = {'_background_': 0}
            for shape in data['shapes']:
                label_name = shape['label']
                if label_name in label_name_to_value:
                    label_value = label_name_to_value[label_name]
                else:
                    label_value = len(label_name_to_value)
                    label_name_to_value[label_name] = label_value
            
            # label_values must be dense
            label_values, label_names = [], []
            for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):
                label_values.append(lv)
                label_names.append(ln)
            assert label_values == list(range(len(label_values)))
            
            lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)
            
            captions = ['{}: {}'.format(lv, ln)
                for ln, lv in label_name_to_value.items()]
            lbl_viz = imgviz.label2rgb(label=lbl, img=imgviz.rgb2gray(img), label_names=label_names, loc='rb')
            # lbl_viz = utils.draw_label(lbl, img, captions)
            
            out_dir = osp.basename(count[i]).replace('.', '_')
            save_folder_name = out_dir #文件夹名称
            split_file_name = osp.basename(count[i]).split('.')#分隔文件名和文件类型
            save_file_name = split_file_name[0]

            out_dir = osp.join(osp.dirname(count[i]), out_dir)

            if not osp.exists(json_file + '/' + 'labelme_json'):
                os.mkdir(json_file + '/' + 'labelme_json')
            labelme_json = json_file + 'labelme_json'
            out_dir1 = labelme_json + '/' + save_folder_name
            if not osp.exists(out_dir1):
                os.mkdir(out_dir1)
 
            PIL.Image.fromarray(img).save(osp.join(out_dir1, 'img.png'))#save_file_name文件名
            #PIL.Image.fromarray(lbl).save(osp.join(out_dir1, save_file_name+'_label.png'))
            utils.lblsave(osp.join(out_dir1, 'label.png'), lbl)
            PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir1, 'label_viz.png'))

            if not osp.exists(json_file + '/' + 'cv2_mask'):
                os.mkdir(json_file + '/' + 'cv2_mask')
            mask_save2png_path = json_file + '/' + 'cv2_mask'

            if not osp.exists(json_file + '/' + 'pic'):
                os.mkdir(json_file + '/' + 'pic')
            img_save2png_path = json_file + '/' + 'pic'

            utils.lblsave(osp.join(mask_save2png_path, save_file_name+'.png'), lbl)
            PIL.Image.fromarray(img).save(osp.join(img_save2png_path, save_file_name+'.png'))


            with open(osp.join(out_dir1, 'label_names.txt'), 'w') as f:
                for lbl_name in label_names:
                    f.write(lbl_name + '\n')
 
            # warnings.warn('info.yaml is being replaced by label_names.txt')
            info = dict(label_names=label_names)
            with open(osp.join(out_dir1, 'info.yaml'), 'w') as f:
                yaml.safe_dump(info, f, default_flow_style=False)
 
            print('Saved to: %s' % out_dir1)
if __name__ == '__main__':
    main()

用上述demo代替”/usr/local/lib/python3.5/dist-packages/labelme/cli/“下的json_to_dataset.py即可。
彩蛋: 上述demo除了可以进行批量转换,还可以直接将我们后续所需要用到的数据分别整理到各自的文件夹下,如图所示:
在这里插入图片描述
其中cv2_mask下存放的是每张图片的掩码,labelme_json文件夹下存放的是批量转换后各个json文件生成的文件夹,pic下存放的是原始数据图片。
Tip:json文件转换之后所生成的掩码图象必须保证是8位的,如果不是8位则需要进行转换。(如果你用的是最新版的labelme,则不需要考虑这个问题,因为其生成的json文件转换得到的掩码图就是8位。)
可利用下述代码查看图片的位数

import cv2
img = cv2.imread('***.jpg')
print(img.dtype)

参考博客1
参考博客2
复习内容1:python对文件夹或文件的操作
复习内容2:python对文件夹或文件的操作

1.3 下载MaskRCNN模型并制作一定的数据格式

github 下载MaskRCNN demo
在MaskRCNN文件夹下新建一个文件命名为train_data
在这里插入图片描述
在该文件夹下新建四个文件夹,分别命名为cv2_mask、json、labelme_json、pic;其中cv2_mask、labelme_json、pic是之前生成的三个文件夹,直接放进来即可。json是labelme标注之后得到的json文件。
在这里插入图片描述
到此为止,MaskRCNN的数据格式已经准备就绪,接下来就可以开始进行训练了。

2.2 Mask-RCNN训练自己的数据集【Part Two: 模型训练】(全部流程总结+部分释义)
2.3 Mask-RCNN训练自己的数据集【Part Three: 用自己训练的模型进行测试】(全部流程总结+部分释义)

  • 3
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
在使用自己的数据集训练Mask-RCNN过程中,可能会遇到以下一些坑: 1. 数据集标注问题:自己的数据集可能没有经过仔细的标注。标注不准确或不一致的物体边界框和分割掩码会影响模型的训练效果。因此,建议在标注数据集时要仔细检查和修正可能存在的错误。 2. 类别不平衡:如果数据集中的某些类别样本数量明显少于其他类别,训练模型时会导致类别不平衡的问题。这会影响模型对于少样本类别的学习效果。可以采用数据增强技术来扩充少样本类别的数据量,或者使用一些类别平衡的损失函数来解决此问题。 3. 没有合适的预训练模型:Mask-RCNN通常需要使用预训练模型进行初始化,以便更快地收敛到一个好的模型。但是,如果没有找到与自己的数据集相似的预训练模型,模型可能需要更多的训练时间和更多的数据才能达到较好的性能。 4. 训练参数选择:在使用自己的数据集训练Mask-RCNN时,一些关键的训练参数需要根据数据集的特点进行适当选择,如学习率、迭代次数、步长等。选择不合适的参数可能导致训练过程出现问题,如梯度爆炸、模型不收敛等。 5. 过拟合问题:如果训练集和验证集的样本相似度较高,模型很容易出现过拟合。过拟合会导致模型在训练集上表现较好,但在未见过的数据上表现较差。可以通过增加训练数据、使用正则化技术或减小模型复杂度等方法来缓解过拟合问题。 解决这些坑的方法包括:仔细检查和修正数据集标注问题,处理类别不平衡,寻找适合的预训练模型,合理选择训练参数,并采取防止过拟合的措施。同时,可以参考相关文献和开源代码,从其他人的经验中学习,并进行模型调优和改进。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值