【深度学习】入门理解ResNet和他的小姨子们（四）---WideResNet

最新推荐文章于 2025-03-26 10:48:13 发布

Shwan_Ma

最新推荐文章于 2025-03-26 10:48:13 发布

阅读量2w

点赞数 8

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shwan_ma/article/details/78168629

版权

文章全称：《Wide Residual Networks》
文章链接：https://arxiv.org/abs/1605.07146

ResNet的成功在深度学习上有着不可磨灭的地位，但是往往为了增加一点精度，就得增加大量的网络层。非常深的网络往往会出现diminishing feature reuse，这往往会导致网络的训练速度会变得相当的慢。为了解决这个问题，本文提出了wide ResNet

以往的深度学习网络一般都是瘦长型的，这样有个好处就是会减少相应的参数量。在电路复杂度理论中证明浅网络往往比深网络需要其指数倍的元件。因此ResNet就设计的thinner and deeper。

但是像ResNet这类网络也会存在着一些问题：
由于梯度在反向传播的时候，可以直接经过shortcut，而不用被强制经过residual block，这会导致可能只有很有限的layer学到了有用的知识，而
更多的layers对最终结果只做出了很少的贡献。这个问题也被称之为diminishing feature reuse。当然在后续的工作中，很多人都朝着解决这个问题的方向做，比如对residual block进行随机失活，类似于特殊的dropout。

基于上述问题，作者认为widening of ResNet blocks可能会提供更有效的方法。事实上作者搭建了16层的wide Residual Network的精度赶上了1000layer 的resNet，并且在训练速度上提升了几倍。

另一个insight: Use of dropout in ResNet blocks

随着

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。