Stanford Cars Datasets

Stanford Cars Datasets

在这里插入图片描述


  • Overview:

    Stanford Cars数据集简称CARS196,由斯坦福大学—人工智能实验室于2013年发布,主要用于细粒度分类任务。 数据集包含196中汽车类型的图像,16185张不同型号的汽车图片,其中8144张为训练集,8041张为测试集。每个类别的图像相当,其中分类基于汽车品牌、车型和年份,例如:2012特斯拉Model S、2012 BMW M3 coupe。
    在这里插入图片描述


  • Download:

下载网址:https://ai.stanford.edu/~jkrause/cars/car_dataset.html
训练集图片下载:car_train.gz
测试集图片下载:car_test.gz
开发工具包devkit:car_devkit.gz
所有图片的tar文件:car_ims.gz
用于训练和测试的所有边框和标签:cars_annos_mat

在这里插入图片描述

README提供了有关汽车196数据集的文件的描述:

  • cars_meta.mat:
    包含类名称的单元格数组,每个类一个。
  • cars_train_annos.mat:
    包含变量“ annotations”,它是长度为num_images的结构数组,其中每个元素都具有字段:
    bbox_x1:边界框的最小x值,以像素为单位
    bbox_x2:边界框的最大x值,以像素为单位
    bbox_y1:边界框的最小y值,以像素为单位
    bbox_y2:边界框的最大y值,以像素为单位
    class:图像所属类的id。
    fname:图像文件夹中的图像文件名。
    “ annotations”变量中包含我们想要的结构数据,包括标签、图像文件名以及图像边界框信息,因此我们只需处理annotations变量并从中提取我们想要的信息
  • cars_test_annos.mat:
    与cars_train_annos.mat相同,但未提供class字段。

提交文件格式:

  • 要提交的文件应该是.txt文件,第M行上为图像M的类别预测。 请注意,图像M对应于提供的注释文件中的第M个注释。 这种格式的文件示例是train_perfect_preds.txt。
  • devkit中包括一个用于评估训练准确性的脚本eval_train.m。 用法是:
    (in MATLAB)
    [accuracy,confusion_matrix] = eval_train('train_perfect_preds.txt')

假设训练预测和测试预测是相同的格式,那么你在训练预测时使用这种函数,在评估服务器下测试预测应该有很好的结果


  • Evaluation:

设置了评估服务器,按照deckit中包含有关提交格式的说明提交文件,即可评估。


  • Citation:

如果使用此数据集,引用以下论文:

3D Object Representations for Fine-Grained Categorization
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13). Sydney, Australia. Dec. 8, 2013.

注意:发布数量具有196个类别,比论文少一类,因为自发布以来已经对其进行了一些请理。数字应该或多或少具有可比性。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值