Deep residual learning for image recognition
阅读地址:Deep residual learning for image recognition
推荐学习视频:ResNet论文逐段精读【论文精读】&【精读AI论文】ResNet深度残差网络
被引用次数:115232(截至2022.05.02)
知乎同篇文章:ResNet 精读笔记和代码实现 - 知乎 (zhihu.com)
官方开源:pytorch_ResNet
个人实现:GitHub:ResNet-Code-with-ReadingNotes
注:建议配合食用Identity Mappings in Deep Residual Networks
提供的思路
神经网络不需要去拟合复杂的底层映射了,只需要拟合在原来输入的基础上要进行哪些偏移,哪些修改,最总只要拟合残差就好了
这样使深的网络不会比浅层网络效果更差,最多只会让后续网络变为恒等映射
提出残差学习结构解决非常深网络的退化问题和训练问题
每层都学习相对于本层输入的残差,然后与本层输入加法求和,残差学习可以加快优化网络,加深层数,提高准确度
直接将网络堆深
- ①梯度消失/梯度爆炸:阻碍收敛(现可以通过初始化权重解决)
- ②网络退化:不是任何网络都能被相同的优化
不拟合底层,拟合残差(如果恒等映射足够好,可以把所有权重都学成0)
本文中shortcut connection只用来进行恒等映射