MMDetection学习笔记-04自定义COCO数据集

最新推荐文章于 2024-05-16 09:27:47 发布

www5599667788

最新推荐文章于 2024-05-16 09:27:47 发布

阅读量517

点赞数

分类专栏： MMDetection 文章标签： python 计算机视觉

本文链接：https://blog.csdn.net/qiufeng886/article/details/120101566

版权

MMDetection 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

以COCO标注格式是JSON，主要由image、categories和annotations 三个字段表示。COCO格式文件的好处是可以用一个文件表示所有的标注数据。程序接收一个COCO.json文件可以处理整个数据集。

整体结构：

{
	#“info”:info, #一般用不上，可以置空
	#"licenses":[license], #一般用不上，可以置空
	images:[image], 
	annotations:[annotation],
	categories:[category]
}
info,image和license共享的字段信息；annotation和category不共享字段信息。

images
images包含多个image实例的数组。
对于一个image类型的实例为：

{
	"file_name":"文件名或文件路径",#最终目标是让训练时候，程序找到这个文件
	"height":360, "width":640,
	"data_captured":"数据获取时间",
	"id":391185 #文件ID
},
#上面代码展示了标注的核心内容，只要把上述标注清楚，程序就可以正常运行。上述代码表示一幅图片img1。img2、img3......等很多实例也是类似img1.下面代码展示了images
images{
	img1,
	img2,
	img3,
	img4,
	......
}

categories
categories包含多个category实例的数组。category结构体描述如下：

{
	"id":int,#类别ID
	"name":string,#类别名
	"supercategory":string#类别父类，例如vehicle(bicycle)，选填。填了也没啥用处，不填还可能报错
}

coco一共有80类，即id会递增到80。一个实际例子如下：
在这里插入图片描述

annotations
annotations是一个包含多个annotation实例的列表。annotation类型本身又包含了一系列的字段。

{
	"id":int,#标注ID
	"image_id":int,#这个标注属于哪张图片
	"category_id":int,#这个标注属于某个类别
	"segmentation":RLE or [polygons],#segmentation格式取决于这个实例是一个单个的对象。iscrowd=0时，使用polygons格式；iscrowd=1时，使用RLE格式
	"area":float,#标注区域面积
	"bbox":[x,y,width,height],#标注框，x,y为标注框的左上角坐标。
	"iscrod":0 or 1 #决定是RLE格式还是polygon格式。单个对象：iscrowd=0；多个对象iscrowd=1
}