解密ResNet：Identity Mappings in Deep Residual Networks论文笔记

最新推荐文章于 2024-08-17 20:13:54 发布

小时候贼聪明

最新推荐文章于 2024-08-17 20:13:54 发布

阅读量2.1w

点赞数 24

分类专栏： deeplearning 论文论文笔记

本文链接：https://blog.csdn.net/wspba/article/details/60572886

版权

本文深入探讨了ResNet中Identity Mappings在深度残差网络中的关键作用，指出其简化训练并防止梯度消失。通过实验比较不同形式的跳跃连接和激活函数位置，证明预激活全连接（full pre-activation）的ResNet-1001能有效避免过拟合，推动了深层网络的发展。

摘要由CSDN通过智能技术生成

论文地址：Identity Mappings in Deep Residual Networks

在上一篇文章中，对MSRA何凯明团队的ResNet进行了介绍（地址），那篇文章中提到了，1202层的ResNet出现了过拟合的问题，有待进一步改进。第二年，何的团队就发表了“Identity Mappings in Deep Residual Networks”这篇文章，分析了ResNet成功的关键因素——residual block背后的算法，并对residual block以及after-addition activation进行改进，通过一系列的ablation experiments验证了，在residual block和after-addition activation上都使用identity mapping（恒等映射）时，能对模型训练产生很好的效果，通过这项改进，也成功的训练出了具有很好效果的ResNet-1001。

在原始的ResNet中，对于每一个residual building block：
这里写图片描述
可以表现为以下形式：