残差网络是在网络(plain network)上加上skip connections(shortcut connections)
plain network
plain network:理论上网络越深,训练结果应该越好,但是实际上的结果却不是,网络加深得到一定程度之后,效果反而会下降(因为梯度消失和梯度爆炸的问题)
ResNet:
1. 将特征作为输入,作用在下下一层的激活函数之前(每两层增加一个捷径)
2. 每两层构成一个残差块,上图中共有5个残差块
3. 残差网络可以解决梯度消失和梯度爆炸的问题,所有可以作用到深层网络中,使之效果更佳
残差网络ResNet
最新推荐文章于 2024-04-18 22:07:18 发布