学习笔记------关于ResNet及其相关细节理解

最新推荐文章于 2022-05-04 14:58:05 发布

R–M

最新推荐文章于 2022-05-04 14:58:05 发布

阅读量737

点赞数 2

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40816775/article/details/102783741

版权

本文探讨了ResNet残差网络的设计原理，解释了为何即使网络加深，其训练效果仍然优秀。网络深度的重要性在于能提取不同级别的特征。1x1卷积用于维度压缩和增加非线性。ResNet结构包含Basic Block和Bottleneck Block，解决深度学习中的梯度消失问题。此外，还讨论了ReLU激活函数可能导致的神经元死亡现象，并提供了ResNet的PyTorch代码实现简介。

摘要由CSDN通过智能技术生成

先膜拜一下何凯明大神的奇妙想法

为什么残差网络即使网络再深，训练的表现却不错，错误会减少

preview

假设有一个大型神经网络，其输入为x，输出激活值为a[l],如果你想增加这个神经网络的深度，就再给这个网络额外添加两层，最后输出为a[l+2],可以把这两层看作ResNet块，即具有近路连接的残差块。假设我们在整个网络中使用Relu激活函数，所以激活值都大于等于0。a[l+2]=g(z[l+2]+a[l])，添加项a[l]是刚添加的跳远连接的输入。

如果z[l+2]=0，那么a[l+2]=a[l]。因为我们假定使用Relu激活函数，并且所有激活值都是负的。结果表明，残差块

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。