Caltech-UCSD Birds-200-2011
-
Overview:
CUB 数据集一共 200 个类别,共 11788 张图片,每张图片除包括类别标签外,还有一个标注的物体边框(Bounding Box)、关键点和一些其他属性,算是一个很细粒度的图像分类的数据集了。
- Download:
下载网址:http://www.vision.caltech.edu/visipedia/CUB-200-2011.html
下载解压后文件夹内部如图所示:
-
images:
包含200个类别的所有鸟类数据集。 -
parts:
- parts.txt:所有的局部部位名称以及id,格式为 <part_id> <part_name>
- part_locs.txt:所有的ground truth的局部定位,格式为 <image_id> <part_id>
- part_click_locs.txt:多个MTurk用户完成的局部定位,格式为 <image_id > <part_id>
-
attributes:
- attributes.txt:包含所有属性名称,格式为 <attribute_id> <attribute_name>
- certainties.txt:包含所有确定性名称,格式为:<certainty_id> <certainty_name>
- image_attribute_labels.txt:每个图像的属性标签集,格式为:<image_id> <attribute_id> <is_present> <certainty_ id>
- class_attribute_labels_continuous.txt:类级别的属性。 该文件包含200行和312个以空格分隔的列,每行对应一个类,每一列对应一个属性,数值是人类认为给定类存在该属性的时间百分比(0到100之间)
五个说明文档:
1. bounding_boxes.txt:包含每张图像的物体边框,格式为 <image_id>
2. classes.txt:包含每张图片的类别序号和名称,格式为 <class_id> <class_name>
3. image_class_labels.txt:包含每张图片对应的类别序号,格式为 <image_id> <class_id>
4. images.txt:包含每张图片的路径信息,格式为 <image_id> <image_name>
5. train_test_split.txt:记录数据集的训练集和测试集划分,格式为 <image_id> <is_training_image>
-
Details
Caltech-UCSD Birds-200-2011(CUB-200-2011)是CUB-200数据集的扩展版本,每个类的图像数量大约增加了一倍,并带有新的局部位置注释。
- 类别数:200
- 图片数量:11,788
- 每张图片批注:15个零件位置,312个二进制属性,1个边界框
-
Citation
如果使用CUB-200-2011,请引用以下技术报告:
Caltech-UCSD Birds-200-2011Dataset
Wah C.,Branson S.,Welinder P.,Perona P.,BelongieS
Computation & Neural Systems Technical Report, CNS-TR-2011-001.