[论文理解]关于ResNet的理解

最新推荐文章于 2022-10-26 21:08:23 发布

aoru

最新推荐文章于 2022-10-26 21:08:23 发布

阅读量342

点赞数 1

分类专栏：神经网络文章标签： ResNet

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aoru45/article/details/90051646

版权

这两天回忆起resnet，感觉残差结构还是不怎么理解（可能当时理解了，时间长了忘了吧），重新梳理一下两点，关于resnet结构的思考。

要解决什么问题

论文的一大贡献就是，证明了即使是深度网络，也可以通过训练达到很好的效果，这跟以往的经验不同，以往由于网络层数的加深，会出现梯度消失的现象。这是因为，在梯度反传的时候，由于层数太深，传递过程又是乘法传递，所以梯度值会越乘越小，梯度消失在所难免。那么怎么才能解决这个问题呢？resnet提供了很好的思路。

怎么解决

从梯度角度

这里一个block的输出变为了常规层的卷积池化加上输入，然后在激活，那么这个结构为什么可以保证深度网络能够收敛呢？

只由这么一个block其实很难看出来，只有在多个block下，才能看出他的优势。看下面的公式。

对于非残差结构:y1=G(F(x,w1))y1最为下一层的输入带入有y2=G(F(y1,w2))那么我们在对w1求梯度的时候呢，根据链式法则dy2dw1=dy2dF∗dFdy1∗dy1dF∗dFdw1全是乘法，所以层数过多就很容易越乘越小。再看看残差结构:y1=G(x+F(x,w1))y2=G(y1+F(y1,w2))链式求导则得到dy2dw1=dy2dy1∗dy1dF∗dFdw1+dy2dF∗dFdy1∗dy1dF∗dFdw1可以看到࿰

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

aoru CSDN认证博客专家 CSDN认证企业博客

码龄13年

1: 原创

63万+: 周排名

217万+: 总排名

342: 访问

: 等级

16: 积分

1: 粉丝

1: 获赞

0: 评论

3: 收藏

私信

关注

热门文章

[论文理解]关于ResNet的理解 342

分类专栏

神经网络 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。