Caltech-UCSD Birds-200-2011

Caltech-UCSD Birds-200-2011

在这里插入图片描述


  • Overview:

    CUB 数据集一共 200 个类别,共 11788 张图片,每张图片除包括类别标签外,还有一个标注的物体边框(Bounding Box)、关键点和一些其他属性,算是一个很细粒度的图像分类的数据集了。


  • Download:

下载网址:http://www.vision.caltech.edu/visipedia/CUB-200-2011.html
下载解压后文件夹内部如图所示:
在这里插入图片描述

  • images:
    包含200个类别的所有鸟类数据集。

  • parts:

    1. parts.txt:所有的局部部位名称以及id,格式为 <part_id> <part_name>
    2. part_locs.txt:所有的ground truth的局部定位,格式为 <image_id> <part_id>
    3. part_click_locs.txt:多个MTurk用户完成的局部定位,格式为 <image_id > <part_id>
  • attributes:

    1. attributes.txt:包含所有属性名称,格式为 <attribute_id> <attribute_name>
    2. certainties.txt:包含所有确定性名称,格式为:<certainty_id> <certainty_name>
    3. image_attribute_labels.txt:每个图像的属性标签集,格式为:<image_id> <attribute_id> <is_present> <certainty_ id>
    4. class_attribute_labels_continuous.txt:类级别的属性。 该文件包含200行和312个以空格分隔的列,每行对应一个类,每一列对应一个属性,数值是人类认为给定类存在该属性的时间百分比(0到100之间)

五个说明文档:
1. bounding_boxes.txt:包含每张图像的物体边框,格式为 <image_id>
2. classes.txt:包含每张图片的类别序号和名称,格式为 <class_id> <class_name>
3. image_class_labels.txt:包含每张图片对应的类别序号,格式为 <image_id> <class_id>
4. images.txt:包含每张图片的路径信息,格式为 <image_id> <image_name>
5. train_test_split.txt:记录数据集的训练集和测试集划分,格式为 <image_id> <is_training_image>


  • Details

    Caltech-UCSD Birds-200-2011(CUB-200-2011)是CUB-200数据集的扩展版本,每个类的图像数量大约增加了一倍,并带有新的局部位置注释。

    1. 类别数:200
    2. 图片数量:11,788
    3. 每张图片批注:15个零件位置,312个二进制属性,1个边界框

  • Citation

    如果使用CUB-200-2011,请引用以下技术报告:

Caltech-UCSD Birds-200-2011Dataset
Wah C.,Branson S.,Welinder P.,Perona P.,BelongieS
Computation & Neural Systems Technical Report, CNS-TR-2011-001.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值