写在前面
1.coco数据集
1. .json文件
coco数据集的样本格式:.json文件,可以由文本文件打开,但是会处于乱码状况,所以最好使用firefox打开,
由于文件可能较大,所以会需要一段时间的加载,然后从原始数据点击到JSON就可以了。
2.文件内容
文件包含五个部分:info/licences/images/annotations/categories
(1)info:主要包含数据集名称、网址、年份等
(2)licenses:版权信息
(3)images:图片的基本信息,名称、URL、宽、高、ID等
(4)annotations:id、area、图像id、bbox大小、categories的id
(5)categories:图片目标检测分类名称,id,具体名字
2.voc数据集
1. xml文件
voc数据集的标注文件是xml格式,可以直接使用ie浏览器打开
2.文件内容
整体包含文件信息folder/filename,以及文件来源,size,object
(1)object具体信息:物体名称、物体角度、是否截断(truncated)、是否难识别(difficult)、bbox信息、以及各个part的name和bbox