计算机视觉经常会用到voc数据集
以如下数据集为例
http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/semantic_contours/benchmark.tgz
Annotations 包含着xml文件,就是利用roLabelImg进行标注
JPEGImages 里面就是原始的图片
train.txt和val.txt中列出的图像才进行使用
SegmentationObject中对图中不同的物体进行的分割(生成png图片),不对其物体所属的类别进行标注
SegmentationClass中的png图用于图像分割分类,png图中对物体的分类像素对应着不同的RGB分量。可以理解为这个就是标签。
ImageSet 包含模型训练,测试要生成的txt文档