ResNet34学习笔记+用pytorch手写实现

最新推荐文章于 2024-08-22 14:30:41 发布

Ginkgo__

最新推荐文章于 2024-08-22 14:30:41 发布

阅读量2.1w

点赞数 13

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42135399/article/details/90371489

版权

本文深入探讨ResNet34网络的两大核心概念：快捷恒等映射与网络架构。介绍了ResNet的两种维度变化处理方式，并通过实验对比了不同选项的效果。此外，还分享了ResNet34的PyTorch实现代码，帮助读者理解并应用ResNet模型。

摘要由CSDN通过智能技术生成

看懂ResNet，需要理解两个点：shortcut的处理，以及网络结构

理解1——Identity Mapping by Shortcuts（快捷恒等映射）

我们每隔几个堆叠层采用残差学习。构建块如图2所示。在本文中我们考虑构建块正式定义为

x和y是考虑的层的输入和输出向量。函数F(x,Wi)表示要学习的残差映射。图2中的例子有两层，F=W2σ(W1x)中σ表示ReLU[29]，为了简化忽略偏置项。F+x操作通过快捷连接和各个元素相加来执行。在相加之后我们采纳了第二种非线性（即σ(y)，看图2）。

公式(1)中的快捷连接既没有引入外部参数又没有增加计算复杂度。这不仅在实践中有吸引力，而且在简单网络和残差网络的比较中也很重要。我们可以公平地比较同时具有相同数量的参数，相同深度，宽度和计算成本的简单/残差网络（除了不可忽略的元素加法之外）。

方程(1)中x和F的维度必须是相等的。如果不是这种情况（例如，当更改输入/输出通道时），我们可以对快捷连接执行线性投影Ws（进行卷积操作）来匹配维度：

我们也可以在方程(1)中使用方阵Ws。但是我们将通过实验表明，恒等映射足以解决退化问题，并且是合算的，因此Ws仅在匹配维度时使用。

理解2——网络架构：

最低0.47元/天解锁文章

关注

13
点赞
踩
110

收藏

觉得还不错? 一键收藏
12
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。