（三）cvat标注文件转为mmdetection可以训练的格式

mm_exploration

已于 2023-09-06 09:14:40 修改

阅读量902

点赞数 1

分类专栏： mmdtection 文章标签：深度学习 python 目标检测

于 2022-02-09 16:05:36 首次发布

本文链接：https://blog.csdn.net/m0_37737957/article/details/122842979

版权

mmdtection 专栏收录该内容

28 篇文章 26 订阅

订阅专栏

一、cvat标注文件注意事项

1、group:目标成组出现，比如自行车和骑车的人
2、occluded/iscrowd:被遮挡，没有完全显示的目标。我认为cvat标注的时候是occluded，但mmdetection使用的关键字是iscrowd.
cvat标注矩形框用于目标检测，导出MOT1.1格式数据，将这种格式数据转为mmdetection能够识别的一种格式。
一个txt按图片拆分多个txt，改变矩形框数据格式，下面是转换示例代码

import os
import mmcv
file_path="/home/mby/mmtracking/data/MOTWOOD/train/MOT-07/img1/"
list_name=os.listdir(file_path)

lines=mmcv.list_from_file('/home/mby/mmtracking/data/MOTWOOD/train/MOT-07/gt/gt.txt')
contents=[line.strip().split(',') for line in lines]

last_name='---'
fo=None
for content in contents:
    this_name=(format(int(content[0]),'06d')+'.PNG')
    if( this_name in list_name):
        if(this_name!=last_name):
            if(fo!=None):
                fo.close()
            fo = open('demo/label/'+format(int(content[0]),'06d') + '.txt', "w")
            last_name = this_name
        content[4] = str(float(content[2]) + float(content[4]))
        content[5] = str(float(content[3]) + float(content[5]))
        line_content = ','.join(content)
        fo.write(line_content + '\n')

二、自定义数据注册代码

mmdetecion在使用自定义数据之前需要注册，下面是数据注册程序，需要放在数据训练程序中。


import os.path as osp
import mmcv
import numpy as np

from mmdet.datasets.builder import DATASETS
from mmdet.datasets.custom import CustomDataset

@DATASETS.register_module()
class WoodDataset(CustomDataset):
    CLASSES = ('Wood',)
    def load_annotations(self, ann_file):
        cat2label = {k: i for i, k in enumerate(self.CLASSES)}
        # load image list from file
        image_list = mmcv.list_from_file(self.ann_file)
        data_infos = []
        # convert annotations to middle format
        for image_id in image_list:
            filename = f'{self.img_prefix}/{image_id}.PNG'
            image = mmcv.imread(filename)
            height, width = image.shape[:2]
            data_info = dict(filename=f'{image_id}.PNG', width=width, height=height)
            # load annotations
            label_prefix = self.img_prefix.replace('image_2', 'label_2')
            lines = mmcv.list_from_file(osp.join(label_prefix, f'{image_id}.txt'))

            content = [line.strip().split(',') for line in lines]
            bbox_names = [x[0] for x in content]
            bboxes = [[float(info) for info in x[2:6]] for x in content]
            gt_bboxes = []
            gt_labels = []
            gt_bboxes_ignore = []
            gt_labels_ignore = []
            for bbox in bboxes:
                gt_labels.append(0)
                gt_bboxes.append(bbox)
            data_anno = dict(
                bboxes=np.array(gt_bboxes, dtype=np.float32).reshape(-1, 4),
                labels=np.array(gt_labels, dtype=np.long),
                bboxes_ignore=np.array(gt_bboxes_ignore,
                                       dtype=np.float32).reshape(-1, 4),
                labels_ignore=np.array(gt_labels_ignore, dtype=np.long))

            data_info.update(ann=data_anno)
            data_infos.append(data_info)

        return data_infos