本文提出Normalizer-Free方法,可设计没有激活归一化层的深度残差网络!其能直接应用于ResNet、RegNet等网络,相同FLOP预算下,可比肩EfficientNet!代码已开源!
注1:文末附【计算机视觉细分垂直方向】交流群(含检测、分割、跟踪、医疗、GAN、Transformer等)
注2:整理不易,欢迎点赞,支持分享!
Characterizing signal propagation to close the performance gap in unnormalized ResNets
- 作者单位:DeepMind
- 大佬复现代码:rwightman/pytorch-image-models
- 论文(已收录于ICLR 2021):https://arxiv.org/abs/2101.08692
Batch Normalization是几乎所有最新图像分类器中的关键组件,但同时也带来了实际挑战:它打破了batch内训练示例之间的独立性,可能会导致计算和内存开销,并经常导致意外的错误。
基于对初始化时深度ResNet的最新理论分析,我们提出了一套简单的分析工具来表征前向信号的传播,并利用这些工