【目标检测】数据集
VOC
- Annotation里面是xml文件,包含了每张图片的标注信息。
- JPEGImage包含了所有的图片。
- ImageSets里有四个文件夹,但是常用的是Main文件夹,里面有对训练、验证和测试集的划分,只有图片名字的前缀。
下载
VOC2007数据集
# 下载训练和验证集
curl -LO http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
# 下载测试集
curl -LO http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
# 解压
tar -xvf VOCtrainval_06-Nov-2007.tar
tar -xvf VOCtest_06-Nov-2007.tar
# 移除压缩包
rm VOCtrainval_06-Nov-2007.tar
rm VOCtest_06-Nov-2007.tar
VOC2012数据集
# 下载
curl -LO http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
# 解压
tar -xvf VOCtrainval_11-May-2012.tar
# 移除压缩包
rm VOCtrainval_11-May-2012.tar
Annotation
Annotation存放的是xml文件,每张图片都有一个同名的xml文件。
<annotation>
<folder>VOC2012</folder> #图片来源
<filename>2007_000027.jpg</filename> #名称
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size> #尺寸
<width>486</width>
<height>500</height>
<depth>3</depth>
</size>
<segmented>0</segmented> #是否用于分割
<object> #包含物体
<name>person</name> #物体类别
<