引文:
@article{wah2011caltech, title={The caltech-ucsd birds-200-2011 dataset}, author={Wah, Catherine and Branson, Steve and Welinder, Peter and Perona, Pietro and Belongie, Serge}, year={2011}, publisher={California Institute of Technology} }
Caltech-UCSD Birds-200-2011 (CUB-200-2011) 数据集是用于细粒度视觉分类任务的最广泛使用的数据集。它包含属于鸟类的 200 个子类别的 11,788 张图像,其中 5,994 张用于训练,5,794 张用于测试。每个图像都有详细的注释:1 个子类别标签、15 个部分位置、312 个二进制属性和 1 个边界框。文本信息来自 Reed 等人。他们通过收集细粒度的自然语言描述来扩展 CUB-200-2011 数据集。为每个图像收集十个单句描述。自然语言描述是通过 Amazon Mechanical Turk (AMT) 平台收集的,要求至少 10 个单词,没有任何子类别和动作信息。
1. 数据集概览
- 数据量:总计包含 11,788 张鸟类图像。
- 训练集:5,994 张图像,用于模型训练。