利用labelme制作coco格式的实例分割数据集（用于mmdetection2.0中的mask部分）

最新推荐文章于 2024-06-05 00:33:01 发布

一只大狼狗

最新推荐文章于 2024-06-05 00:33:01 发布

阅读量4.9k

点赞数 14

文章标签： python

本文链接：https://blog.csdn.net/weixin_45656040/article/details/108488298

版权

本文参考以下链接并修改了部分内容：https://blog.csdn.net/weixin_42882838/article/details/102843082

前言之一：
在mmdetection2.0框架下，利用coco格式的数据集进行实例分割默认只需要train2017和val2017两部分（当然也可以将test中的目录修改成test2017，但没必要。）
coco_instance文件里的部分默认配置
mmdetection2.0框架下coco格式数据集文件如下图放置：
（运行完本文的.py文件后即可生成以下文件夹）
在这里插入图片描述

前言之二：

数据集标注方式

当一张图片里没有多个同类别的物体，使用car,computer,bottle等标签直接进行标注；当一张图片里同个类别有多个物体时，标签采用sofa-1,sofa-2,desk-1,desk-2等标签-数字的格式进行标注；如果同一物体在遮挡情况下被分为多个部分，则不同部分都用同一个标签（具体如下图所示，牙膏的三个部分标签均为toothpaste）。在这里插入图片描述
最后得到的json文件里的segmentation是分为三部分，bbox只存在一个（在笔者找的其他资料里，都是分为三个独立的牙膏部分，得到三个segmentation以及三个相应的bbox，显然不符合实际情况）。

前言之三：
建议在使用labelme进行对数据集标注时，将生成的.json文件放置在与数据集相同的路径下以避免一些不必要的麻烦。即下图：

在这里插入图片描述
否则，生成的json文件里的imagePath可能出现下图所示的情况：

如果实在是没办法，没有在同一路径下，imagePath会比较复杂（可能是windows系统用\分隔号，ubuntu系统则会是/分隔号，这一点是笔者的猜测），根据不同的情况修改后文代码。

Firstly, creat_txt.py

文件夹的建立如下：
在这里插入图片描述
所有的.jpg文件放在images文件夹下，所有的.json文件（labelme标注完成后生成的文件）放在labelme/total2017文件夹下。

# !/usr/bin/python
# -*- coding: utf-8 -*-
import os
import random

trainval_percent = 1 # No test sample
train_percent = 0.9
jsonfilepath = 'labelme/total2017'
txtsavepath = './'
total_xml = os.listdir(jsonfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('./trainval2017.txt', 'w')
ftrain = open('./train2017.txt', 'w')
fval = open('./val2017.txt', 'w')
ftest = open('./test2017.txt', 'w')  #Still create test2017.txt

for i in list:
    name = total_xml[i][:-5] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)
ftrainval.close()
ftrain.close(