前言
啊啊啊啊啊,不太理解任务 (百脸懵逼)
一、VOC注释格式
整体结构
图片基本信息:例如文件名(folder、filename)、图片来源(source);
图片尺寸(size):包含长、宽、通道数、以及是否有对应的语义注释;
物体信息(object):图中单个物体的具体信息。因为一张图中不只有一个物体,因此object是可以有多个的(图中有四个object的信息)。
二、COCO注释格式
.json主体结构如图
info:对数据集的描述;
licenses:版权相关的信息;
以上两个我们影响不大。下面看看最重要的三个:
images:主要涉及图片的文件名、宽高、image的id
annotations:主要涉及到image的id、Bounding Box大小、categories类别)的id、annotations(标注)的id
categories:主要涉及categories的id、具体的种类名称
总结
上次汇报的时候,我和师兄说我自己下载了图片做标签,然后放入yolo3中进行训练和预测,不过因为做的数据集太少了,导致失败了。虽然师兄没听懂emmmm 师兄让我去自己参考格式写数据集,emmm所以是按照图片自己写注释吧。
嗯,如果我的理解有误的话,希望师兄师姐看到了跟我d一声吧