项目地址:https://github.com/dmlc/gluon-cv
摘要
许多最近的进步在图像分类研究领域,归功于训练处理提炼,例如改变数据增加和优化方法。然而,在文献中,大多数改进不是简单地提到实现细节,就是只在源代码中可见。在这篇文章中,我们将考查一个集合在提炼和经验评估他们的影响在最后的模型精度上,通过消融研究。我们将展示,通过结合这些提炼在一起,我们能够明显地提高各种CNN模型。例如,我们提高ResNet-50的第一认证精度从75.3%到79.29%在ImageNet上。我们也证明提高在图像分类精度上导致较好的迁移学习性能在其它应用领域,例如目标检测和语义分割。
对比结果
总结
在这篇文章中,我们研究了十几个技巧去训练深度卷积神经网络来提高模型精度。这些技巧引入细微的变化对模型的框架,数据预处理,损失函数,以及学习策略。我们的实验结果在ResNet-50,Iception-V3和MobileNet 表明这些技巧一致提高模型精度。比较兴奋地,堆积所有他们一起将会导致明显提高精度。另外,这些提高预训练模型显示强的优势在迁移学习,它提高目标检测和语义分割。
了解更多关于《计算机视觉与图形学》相关知识,请关注公众号:
下载我们视频中代码和相关讲义,请在公众号回复:计算机视觉课程资料