细粒度的车辆分类是对车辆的品牌、型号和年份进行分类的任务。 这是一项非常具有挑战性的任务,因为不同类型但颜色和视点相似的车辆通常看起来比相同类型但颜色和视点不同的车辆更相似。 车辆制造商、型号和年份与车辆颜色相结合 - 在车辆搜索、重新识别、跟踪和交通分析等多种应用中非常重要。 在这项工作中,我们研究了最近几个具有里程碑意义的卷积神经网络 (CNN) 架构对车辆细粒度分类任务的适用性,这些架构在大规模图像分类任务中显示出最佳结果。 我们比较了网络 VGG16、几个 ResNet、Inception 架构、最近的 DenseNet 和 MobileNet 的性能。 对于分类,我们使用 Stanford Cars-196 数据集,其中包含 196 种不同类型的车辆。 我们研究了 CNN 训练的几个方面,例如数据增强和从头开始训练与微调。 重要的是,我们在架构或训练过程中没有引入任何特定于车辆分类的方面。 我们的最终模型达到了 94.6% 的最新分类准确率,优于所有相关工作,甚至是专门为任务量身定制的方法,例如 通过包括车辆部件检测。
关键词:车辆分类,细粒度分类,汽车分类,车辆分析,交通分析,汽车
随着 CNN 模型在细粒度分类任务中取得最先进的结果,提供成熟且有据可查的基线来比较新方法变得越来越重要。 这项工作在斯坦福 Cars-196 数据集上研究了最近具有里程碑意义的 CNN 架构。 由于数据集的规模较小,结果表明从头开始训练 CNN 不会产生令人满意的准确性。 对在 ImageNet 上训练的现有最先进架构进行微调会产生更好的结果,可以通过数据增强进一步改进。 除了为许多重要的 CNN 架构建立基线外,我们的 DenseNet-161 模型甚至在 Stanford Cars-196 上设置了 94.6% 的分类准确率,比之前的方法高出 1.5%。