Deep Residual Learning for Image Recognition
摘要:深度神经网络很难训练,我们提出一种残差学习物流框架比之前更深,我们显示重整作为网络的输入,提供了有利的证据表明这种残差网络更容易被训练与优化;在imagenet dataset里面深度是vgg的8倍,取得第一的名次,提出了网络的深度对于识别任务起到重要的作用;
1、介绍:随着网络深度的增加,网络会出现梯度消失/梯度爆炸的情况,阻碍收敛的过程;通过归一化与标准化 可以解决这个问题,随机梯度下降(SGD)与反向传播,提出第二个问题精确率出现饱和的情况,是层数的增加引起的,并不是过拟合;准确率的下降说明系统不是很容易优化,然而存在一种解决方案:添加直接映射,其他层复制于更浅层的网络层。此表明更深的网络并未出现更高的训练错误率;
在本文中,提出一种可以解决这样问题的残差网络,图2
H(x)为潜在的映射,H(x)=F(x)+x 假设优化残差网络比原始网络更容易,更