转载自VOC和COCO数据集讲解_voc数据集和coco数据集区别_追光少年羽的博客-CSDN博客
用于学习记录
1. VOC格式
VOC_ROOT #根目录
├── JPEGImages # 存放源图片
│ ├── aaaa.jpg
│ ├── bbbb.jpg
│ └── cccc.jpg
├── Annotations # 存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
│ ├── aaaa.xml
│ ├── bbbb.xml
│ └── cccc.xml
└── ImageSets
└── Main
├── train.txt # txt文件中每一行包含一个图片的名称
└── val.txt
其中JPEGImages目录中存放的是源图片的数据,(当然图片并不一定要是.jpg格式的,只是规定文件夹名字叫JPEGImages);
Annotations目录中存放的是标注数据,VOC的标注是xml格式的,文件名与JPEGImages中的图片一一对应;
ImageSets/Main目录中存放的是训练和验证时的文件列表,每行一个文件名(不包含扩展名){随机划分训练集和验证集,训练集的文件名列表存放在ImageSets/Main/train.txt
,验证集的文件名列表存放在ImageSets/Main/val.txt
。}
2. COCO格式
COCO_ROOT #根目录
├── annotations # 存放json格式的标注
│ ├── instances_train2017.json
│ └── instances_val2017.json
└── train2017 # 存放图片文件
│ ├── 000000000001.jpg
│ ├── 000000000002.jpg
│ └── 000000000003.jpg
└── val2017
├── 000000000004.jpg
└── 000000000005.jpg
其中train2017
和val2017
称为set_name
,annnotations
文件夹中的json
格式的标注文件名要与之对应并以instances_
开头,也就是instances_{setname}.json
。