VOC2012:
---Annotations:(XML文件,文件内容同VOC2007类似)
---ImageSets:
---Action:包含10个动作标签,分别是:jumping、phoning、playinginstrument、reading、ridingbike、ridinghorse、running、takingphoto、usingcomputer、walking.
标签内容格式:2011_003426 1 1 (第一个1表示图像中包含的人数。第二个表示图像中人的动作状态是否满足:jumping,显然1代表跳)
2011_003426 2 -1(第一个2表示图像中包含的人数。第二个表示图像中人的动作状态是否满足:jumping,显然-1代表两个人中只有一个人符合跳的动作)
---Layout:标签内容格式: 2008_001501 9 (表示图像中人的个数为9)
---Segmentation:用于图像的语义分割部分。(略)
---JPEGImages:(jpeg图片文件)
---SegmentationClass:用于图像的语义分割部分。(略)
---SegmentationObject:用于图像的语义分割部分。(略)