Deep Residual Learning for Image Recognition,由Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun于2016年发表在CVPR上
1512.03385 (arxiv.org)https://arxiv.org/pdf/1512.03385
下图中,左侧为VGG19网络,中间为34层的普通网络,右侧为34层的深度残差网络ResNet。
从图中可以直观感受到ResNet的特点:
- ResNet直接使用stride=2的卷积做下采样,并且用average pool层替换了全连接层。
- ResNet在网络中引入了残差模块,输入和输出进行跳跃连接,综合形成残差单元。
- 同时,当feature map大小降低一半时,feature map的数量增加一倍,图中虚线就表示feature map数量发生了改变,ResNet通过这种变化保持网络层的复杂度。