本系列旨在介绍ResNet相关系列及变体的基础知识,本篇主要介绍ResNetv1,其他介绍见如下blog目录:
ResNetv1
Resnet作为最基础原始的网络结构,需要深刻理解原理。
发现问题
理论上网络越深效果越好,因为CNN越深越能提取到更丰富更抽象的特征。但是实验发现深度网络出现了退化问题(Degradation problem):网络深度增加时,网络准确度出现饱和,甚至出现下降。(观察知并不是过拟合问题,深层网络存在着梯度消失或者爆炸的问题,这使得深度学习模型很难训练。但是现在已经存在一些技术手段如BatchNorm来缓解这个问题)。进一步发现,深层网络中的一些层很难直接拟合这个恒等映射函数H(x) = x。于是以此为出发点,提出残差思想。
解决问题
把网络设计为 H ( x ) = F ( x ) + x H(x) = F(x) + x H