1、文章信息
作者:Kaiming He等人
单位:Microsoft Research
期刊:CVPR
题目:Deep Residual Learning for Image RecognitionResNet
2、背景目的及结论
2.1背景
在深度重要性的驱动下,一个问题出现了:学习更好的网络就像堆叠更多层一样简单吗?回答这个问题的一个障碍是臭名昭著的梯度消失/爆炸问题,它从一开始就阻碍了收敛。然而,这个问题已经通过归一化初始化和中间归一化层得到了很大程度的解决,这使得具有数十层的网络开始收敛随机梯度下降(SGD)与反向传播。但更深层次的神经网络开退化。层数更深,但精度下降的情况如下:
2.2目的
本文中,我们通过引入深度残差学习框架来解决退化问题。最基础框架如下图:
3、实现细节
3.1文中提到的两种基础架构
<