1、引言
在这个项目中,我们的网络需要在10分钟内完成训练。为了获得更好的效果,我们使用了ResNet18[1]网络,ResNet专门设计用于解决深度学习中的梯度消失和梯度爆炸问题。ResNet最初由微软亚洲研究院的Kaiming He等人在2015年提出,并在ImageNet图像识别比赛中取得了非常好的成绩。原始的ResNet网络是用于训练ImageNet[2]数据集,因此我们必须改进原始的网络来适应本次项目的数据集,下面我将详细介绍ResNet18以及我为它来适应我们的数据集所做的全部工作。
注:本文最终结果10分钟精度88%!
2 ResNet18 网络
2.1 总体架构
ResNet网络是在2015年由微软实验室中的何凯明等几位大神提出,论文地址是《Deep Residual Learning for Image Recognition》;是在CVPR 2016发表的一种影响深远的网络模型,由何凯明大神团队提出来,在ImageNet的分类比赛上将网络深度直接提高到了152层,前一年夺冠的VGG只有19层。斩获当年ImageNet竞赛中分类任务第一名,目标检测第一名。获得COCO数据集中目标检测第一名,图像分割第一名,可以说ResNet的出现对深度神经网络来说具有重大的历史意义。它的原始输入是 224 x 224 RGB 图像,与我们的情况相比,它的分辨率要高得多。ResNet18是ResNet系列中的一个相对较小的模型,它共包含18层神经网络结构,输入层:224x224大小的RGB图像作为输入