PASCAL VOC数据集格式以及标签软件labelling的使用
1. 数据集格式及分布
PASCAL VOC数据集由三个部分构成,JPEGImages,Annotations,ImageSets。
JPEGImages:存放的是训练与测试的所有图片。
Annotations:里面存放的是每张图片打完标签所对应的XML文件
ImageSets:里面有个Main文件夹,其中包含存储着图片名称的txt文件,分为训练与测试。
2.制作标签
制作标签需要的软件:https://github.com/tzutalin/labelImg
其中包括windows与Linux版本。
操作界面
- 点击Open Dir ,选择文件路径,路径不能包含中文;
- 点击Change Save Dir, 选择xml保存路径(不包含中文);
- Creat RectBox, 框选物体,输入标签名称,点击Save保存,后面图片自动选择上一张标签名称。
- PascalVOC ,默认为PascalVOC数据集标准,可切换到YOLO
- difficult,右上角edit label 下的difficult表示是否难识别。
参考博文与链接
1:https://blog.csdn.net/weixin_41683218/article/details/81135338
2:https://github.com/tzutalin/labelImg