关于残差网络Resnet的理解

最新推荐文章于 2023-11-18 20:07:31 发布

jyli2_11

最新推荐文章于 2023-11-18 20:07:31 发布

阅读量5.9k

点赞数 5

分类专栏： DL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jyli2_11/article/details/76098361

版权

Deep Residual Learning for Image Recognition 这篇论文已很有名

参考了大家阅读后的看法http://www.jianshu.com/p/e58437f39f65，也想聊聊自己阅读后的理解

网络深度是影响深度卷积神经网络性能的一大因素，但是研究者发现当网络不断加深时，训练的结果并不好。这不是因为过拟合，因为过拟合的话应该是训练集上结果好，测试集不好，但深度网络出现的现象是训练集上的效果就不好。而且这种现象还会随着深度加深而变差。这并不符合逻辑，因为深层网络在训练时，可以是在浅层网络的函数上加上一个恒等变换。而深层网络显然没有把这种恒等变换学习到。因此，提出了Resnet。

网络结构是有好多个block组成，每个block的构成如下图，加入了一个shortcut connections 从函数上来看就是加入了一个恒等变换。

从正向传播上来看，引入恒等变换可以使网络参数调整作用更大。这个地方引用下知乎上一个特别好的回答（http://www.jianshu.com/p/e58437f39f65）

“F是求和前网络映射，H是从输入到求和后的网络映射。比如把5映射到5.1，那么引入残差前是F'(5)=5.1，引入残差后是H(5)=5.1, H(5)=F(5)+5, F(5)=0.1。这里的F'和F都表示网络参数映射&#x

最低0.47元/天解锁文章

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。