目标检测(一)数据集处理与读取
开始
账号注册的比较晚,本来准备好好记录平时的一些有价值的问题,结果一直没写,这次为了督促自己学习,报名参加了Datawhale12月组队学习,以后会开始坚持记录,这几篇虽是打卡但尽量不限于组队学习的内容
内容参考:Datawhale Task01: 两个年轻人-目标检测基础和VOC数据集
一· VOC数据集简介
做深度学习目标检测都会接触到VOC这个数据集,一般很少用到整个数据集,但是一般都会按照它的格式准备自己的数据集。VOC数据集是目标检测领域最常用的标准数据集之一,几乎所有检测方向的论文,如faster_rcnn、yolo、SSD等都会给出其在VOC数据集上训练并评测的效果。下面是下载VOC数据集后的目录构成以及各个文件夹的内容格式:
VOC2012
├── Annotations # 每张图片相关的标注信息,xml格式
├── ImageSets
│ ├── Layout # train,valid,test和train+valid数据集的文件名
│ ├── Main # 各个类别所在图片的文件名
│ └── Segmentation # 分割所用数据集的文件名
├── JPEGImages # 包括训练验证测试用到的所有图片
├── SegmentationClass # 存放语义分割相关图片
└── SegmentationObject # 存放实例分割相关图片
如下图为Annotations中xml文件中包裹的图片标注信息