Pascal VOC数据格式转COCO数据格式脚本(Object Detection)

本文介绍了COCO数据集的结构,包括info、images、licenses、annotations和categories,特别是针对Object Instance的标注格式。详细解析了annotation中的segmentation(包括polygon和RLE格式)以及bbox信息。此外,还讨论了categories字段,展示了category结构体的示例。最后提到了PASCAL VOC到COCO的转换脚本。
摘要由CSDN通过智能技术生成

1. 前言

1.1 COCO数据集

COCO的全称是Common Objects in COntext,是微软团队提供的一个可以用来进行图像识别的数据集。MS COCO数据集中的图像分为训练、验证和测试集。COCO通过在Flickr上搜索80个对象类别和各种场景类型来收集图像,其使用了亚马逊的Mechanical Turk(AMT)来收集数据。COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。

1.2 COCO数据基本结构

这3种类型共享下面所列的基本类型,包括info、image、license,而annotation类型则呈现出了多态,会根据不同的任务具有不同的数据标注形式。

{
   
"info" : info,
"images" : [image], 
"annotations" : [annotation],
"licenses" : [license],
}

info{
   
"year" : int,
"version" : str,
"description" : str,
"contributor" : str,
"url" : str,
"date_created" : datetime,
}

image{
   
"id" : int,
"width" : int,
"height" : int,
"file_name" : str,
"license" : int,
"flickr_url" : str,
"coco_url" : str,
"date_captured" : datetime,
}

license{
   
"id" : int,
"name" : str,
"url" : str,
}

除了Annotation数据之外的数据类型举例如下:
1)info类型,比如一个info类型的实例:

"info":{
   
	"description":"This is stable 1.0 version of the 2014 MS COCO dataset.",
	"url":"http:\/\/mscoco.org",
	"version":"1.0","year":2014,
	"contributor":"Microsoft COCO group",
	"date_created":"2015-01-27 09:11:52.357475"
}

2)Images类型,Images是包含多个image实例的数组,对于一个image类型的实例:

{
   
	"license":3,
	"file_name":"COCO_val2014_000000391895.jpg",
	"coco_url":"http:\/\/mscoco.org\/images\/391895",
	"height":360,"width":640,"date_captured":"2013-11-14 11:18:45",
	"flickr_url":"http:\/\/farm9.staticflickr.com\/8186\/8119368305_4e622c8349_z.jpg",
	"id":391895
}

3)licenses类型,licenses是包含多个license实例的数组,对于一个license类型的实例:

{
   
	"url":"http:\/\/creativecommons.org\/licenses\/by-nc-sa\/2.0\/",
	"id":1,
	"name":"Attribution-NonCommercial-ShareAlike License"
}

1.3 Object Instance 类型的标注格式

1)整体JSON文件格式
Object Instance这种格式的文件从头至尾按照顺序分为以下段落:

{
   
    "info": info,
    "licenses": [license],
    "images": 
  • 9
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值