每天五分钟计算机视觉：为什么残差网络ResNet如此强大？

最新推荐文章于 2024-04-26 16:08:14 发布

幻风_huanfeng

最新推荐文章于 2024-04-26 16:08:14 发布

阅读量708

点赞数 24

分类专栏：计算机视觉文章标签：计算机视觉 cnn 人工智能 ResNet 卷积神经网络神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huanfeng_AI/article/details/134868005

版权

计算机视觉专栏收录该内容

47 篇文章 7 订阅 ¥19.90 ¥99.00

订阅专栏

本文重点

为什么ResNet效果会这么好，为什么构建更深层次的 ResNet网络的同时还不降低它们在训练集上的效率。本文解释一下为什么ResNet会这么优秀。

残差块

残差网络如此优秀的原因就是残差块。我们来看一下残差块的a[l+2]的计算过程，即a[l+2] = g(z[l+2] +a [l])。

如果将这个表达式展开，那么a[l+2] =g (W[l+2]a[l+1] + b[l+2] + a[l])

这就是残差块的计算表示式

残差块的优势

如果此时使用 L2 正则化或权重衰减，它会压缩W[l+2]的值。假如将其压缩为W[l+2] = 0，同时假设b[l+2] = 0，那么残差块的表达式就变为了a[l+2] = g(a[l]) =a[l]（Relu激活函数当值大于0时，激活值是其本身）。

这说明了即使出现参数为0的极端情况，残差块也可以学习到这个恒等式a[l+2]=a[l]，跳跃连接使我们很容易得出a[l+2] = a[l]。这意味着，即使给神经网络增加了这两层，它的效率也并不逊色于更简单的神经网络，因为学习恒等函数对它来说很简单。尽管它多了两层，也只把a[l]的值赋值给a[l+2]。所以给大型神经网络增加两层，不论是把残差块添加到神经网

了解本专栏

幻风_huanfeng

关注

24
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
每天五分钟计算机视觉：为什么残差网络ResNet如此强大？

为什么ResNet效果会这么好，为什么构建更深层次的 ResNet网络的同时还不降低它们在训练集上的效率。本文解释一下为什么ResNet会这么优秀。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

幻风_huanfeng 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。