VOC数据集格式转化成COCO数据集格式

青年夏日科技

已于 2022-05-24 23:08:06 修改

阅读量1w

点赞数 8

文章标签：目标检测深度学习计算机视觉

于 2021-03-11 23:47:15 首次发布

本文链接：https://blog.csdn.net/sinat_28371057/article/details/114683354

版权

本文详细介绍了如何将VOC数据集格式转换为COCO数据集格式，主要涉及标注文件的转化，包括理解VOC的.xml标注文件和COCO的json文件结构。作者提供了两个关键函数，分别用于通过txt文件和直接处理Annotations文件夹来生成COCO格式的json文件，便于深度学习模型如CenterNet的训练。

摘要由CSDN通过智能技术生成

VOC数据集格式转化成COCO数据集格式
一、唠叨
之前写过一篇关于coco数据集转化成VOC格式的博客COCO2VOC，最近读到CenterNet的官方代码，实现上则是将voc转化成coco数据格式，这样的操作我个人感觉很不习惯，也觉得有些奇葩，可能是每个人习惯不一样吧，我们知道有时候我们会采用labelImg标注数据，标注出来的格式就是voc，如果直接训练就可以用来训练是不是更加友好。

为了不大规模修改原始训练代码（虽然自己修改了一个版本的voc数据集就能直接训练centernet 😊）,同时也看到网上很多大佬也做了将VOC数据格式转化成COCO用于其训练，这里我自己做一个精细一点的，作为笔记。

二、转化过程
数据格式的转换实际是annotation标注文件的转化，voc的数据标注文件为以.xml结尾的文件，而且每张图片均有一个对应的同名标注文件；COCO则是将所有的标注信息写在一个json文件中。VOC数据集目录如下：

在之前的coco2voc博客中做了详细的介绍，现在直接开始转化，目标就是将Annotations中的所有标注文件中的bbox标注信息转化为json文件，根据训练集和测试集，则主要转化为四个json文件，分别是test.json、train.json、val.json和trainval.json .这里我根据ImageSets中的train.txt val.txt trainval.txt生成后三个json文件，当然也可以直接从Annotations文件夹生成。

VOC2COCO.py

import xml.etree.ElementTree as ET
import os
import json
 
coco = dict()
coco['images'] = []
coco['type'] = 'instances'
coco['annotations'] = []
coco['categories'] = []
 
category_set = dict()
image_set = set()
 
category_item_id = -1
image_id = 20180000000
annotation_id = 0
 
def addCatItem(name):
    global category_item_id
    category_item = dict()
    category_item['supercategory'] = 'none'
    category_item_id += 1
    category_item['id'] = category_item_id
    category_item['name'] = name
    coco['categories'].append(category_item)
    category_set[name] = category_item_id
    return category_item_id
 
def addImgItem(file_name, size):
    global image_id
    if file_name is None:
        raise Exception('Could not find filename tag in xml file.')
    if size['width'] is None:
        raise Exception('Could not find width tag in xml file.')
    if size['height'] is None:
        raise Exception('Could not find height tag in xml file.')
    image_id += 1
    image_item = dict()
    image_item['id'] = image_id
    image_item['file_name'] = file_name
    image_item['width'] = size['width']
    image_item['height'] = size['height']
    coco['images'].append(image_item)
    image_set.add(file_name)
    return image_id
 
def addAnnoItem(object_name, image_id, category_id, bbox):
    global annotation_id
    annotation_item = dict()
    annotation_item['segmentation'] = []
    seg = []
    # bbox[] is x,y,w,h
    # left_top
    seg.append(bbo