文章目录
前言
本文的主要贡献在于通过理论分析和大量实验证明使用恒等映射(
identity mapping
)作为快捷连接(skip connection
)对于残差块的重要性。同时,将BN/ReLu
这些activation
操作挪到了Conv
(真正的weights filter操作)之前,提出“预激活“操作,并通过与”后激活“操作做对比实验,表明对于多层网络,使用了预激活残差单元(Pre-activation residual unit
) 的resnet v2
都取得了比resnet v1
(或 resnet v1.5)更好的结果。
摘要
近期已经涌现出很多以深度残差网络(deep residual network)为基础的极深层的网络架构,在准确率和收敛性等方面的表现都非常引人注目。本文主要分析残差网络基本构件(residual building block
)中的信号传播,本文发现当使用恒等映射(identity mappi