Stanford Cars Datasets

最新推荐文章于 2025-02-22 00:32:45 发布

一只野良猫w

最新推荐文章于 2025-02-22 00:32:45 发布

阅读量5.9k

点赞数 4

分类专栏： CV学习文章标签：深度学习计算机视觉人工智能

本文链接：https://blog.csdn.net/qq_37933128/article/details/126585100

版权

CV学习专栏收录该内容

15 篇文章

订阅专栏

Stanford Cars Datasets

在这里插入图片描述

Overview:

Stanford Cars数据集简称CARS196，由斯坦福大学—人工智能实验室于2013年发布，主要用于细粒度分类任务。数据集包含196中汽车类型的图像，16185张不同型号的汽车图片，其中8144张为训练集，8041张为测试集。每个类别的图像相当，其中分类基于汽车品牌、车型和年份，例如：2012特斯拉Model S、2012 BMW M3 coupe。

Download：

下载网址：https://ai.stanford.edu/~jkrause/cars/car_dataset.html
训练集图片下载：car_train.gz
测试集图片下载：car_test.gz
开发工具包devkit：car_devkit.gz
所有图片的tar文件：car_ims.gz
用于训练和测试的所有边框和标签：cars_annos_mat

在这里插入图片描述

README提供了有关汽车196数据集的文件的描述：

cars_meta.mat：
包含类名称的单元格数组，每个类一个。
cars_train_annos.mat：
包含变量“ annotations”，它是长度为num_images的结构数组，其中每个元素都具有字段：
bbox_x1：边界框的最小x值，以像素为单位
bbox_x2：边界框的最大x值，以像素为单位
bbox_y1：边界框的最小y值，以像素为单位
bbox_y2：边界框的最大y值，以像素为单位
class：图像所属类的id。
fname：图像文件夹中的图像文件名。
“ annotations”变量中包含我们想要的结构数据，包括标签、图像文件名以及图像边界框信息，因此我们只需处理annotations变量并从中提取我们想要的信息
cars_test_annos.mat：
与cars_train_annos.mat相同，但未提供class字段。

提交文件格式：

要提交的文件应该是.txt文件，第M行上为图像M的类别预测。请注意，图像M对应于提供的注释文件中的第M个注释。这种格式的文件示例是train_perfect_preds.txt。
devkit中包括一个用于评估训练准确性的脚本eval_train.m。用法是：
(in MATLAB）
[accuracy，confusion_matrix] = eval_train('train_perfect_preds.txt')

假设训练预测和测试预测是相同的格式，那么你在训练预测时使用这种函数，在评估服务器下测试预测应该有很好的结果

Evaluation：

设置了评估服务器，按照deckit中包含有关提交格式的说明提交文件，即可评估。

Citation：

如果使用此数据集，引用以下论文：

3D Object Representations for Fine-Grained Categorization
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13). Sydney, Australia. Dec. 8, 2013.

注意：发布数量具有196个类别，比论文少一类，因为自发布以来已经对其进行了一些请理。数字应该或多或少具有可比性。