resnet 补充介绍(p42-p43)

最新推荐文章于 2022-03-08 21:20:11 发布

bohu83

最新推荐文章于 2022-03-08 21:20:11 发布

阅读量2.2k

点赞数

分类专栏： python 文章标签： cnn 神经网络 resnet 残差网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bohu83/article/details/122793168

版权

python 专栏收录该内容

40 篇文章 3 订阅

订阅专栏

概述

本文老师补充介绍了resnet的论文。给出了一些解读先整理下。

残差网络的由来

论文《Deep Residual Learning for Image Recognition》，通常与浅层网络相比，更深的网络的表现不应该更差，但是 56层的神经网络表现明显要比20层的差，注意截图是错误率的曲线

为什么网络需要多层？

因为CNN能够提取low/mid/high-level的特征，网络的层数越多，意味着能够提取到不同level的特征越丰富。并且，越深的网络提取的特征越抽象，越具有语义信息。

为什么层数多了准确率反而下降？

简单地增加深度，会导致梯度爆炸。

解决方法是正则化初始化和中间的正则化层（Batch Normalization）。

正则化产生的新问题是网络退化（网络层数增加，但是在训练集上的准确率却饱和甚至下降了。）上面图说明不是过拟合（应该表现为在训练集上表现更好，验证集表现差）

解决

我们可以使用一个非线性变化函数来描述一个网络的输入输出，即输入为X，输出为F(x)，

当我们强行将一个输入添加到函数的输出的时候，虽然我们仍然可以用H(x)来描述输入输出的关系，但是这个H(x)却可以明确的拆分为F(x)和X的线性叠加。

没有复杂公式，没有复杂理论，一种变换的表达方式，但是解决了上面的问题。Resnet提供了两种选择方式，也就是identity mapping和residual mapping，如果网络已经到达最优，继续加深网络，residual mapping将被push为0，只剩下identity mapping，这样理论上网络一直处于最优状态了，网络的性能也就不会随着深度增加而降低了。

残差是什么？

其中ResNet提出了两种mapping：一种是identity mapping，指的就是图1中”弯弯的曲线”，另一种residual mapping，指的就是除了”弯弯的曲线“那部分，所以最后的输出是 H(x)=F(x)+x

identity mapping顾名思义，就是指本身，也就是公式中的x，而residual mapping指的是“差”，也就是H(x)−x，所以残差指的就是F(x)部分。

推导：

没讲，跳过了。

细节：

如图所示，如果F(x)和x的channel个数不同怎么办，因为F(x)和x是按照channel维度相加的，channel不同怎么相加呢？

这个图：右侧有”实线“和”虚线“两种连接方式，实线部分他们的channel个数一致（第一部分64），虚线的的Connection部分(”第一个绿色矩形和第三个绿色矩形“)分别是channel个数不同(64和128)。

1×1 卷积

用1×1的过滤器进行卷积，似乎用处不大，只是对输入矩阵乘以某个数字。还要考虑深度

核心作用是1x1x#filters（过滤器数量） ,根据不同的通道数，来调整的channel维度的；

上图identity 是直接操作：对应上面的“实线”那种。 $H(x)=F(x)+x$

convolution 是卷积操作， $H(x)= F(x)+Wx$

W 就是起到卷积作用。实现可以1x1x chanel

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
resnet 补充介绍(p42-p43)

概述本文老师补充介绍了resnet的论文。给出了一些解读先整理下。残差网络的由来论文《Deep Residual Learning for Image Recognition》，通常与浅层网络相比，更深的网络的表现不应该更差，但是 56层的神经网络表现明显要比20层的差，注意截图是错误率的曲线为什么网络需要多层？因为CNN能够提取low/mid/high-level的特征，网络的层数越多，意味着能够提取到不同level的特征越丰富。并且，越深的网络提取的特征越抽象，越具有语义信息。
复制链接

扫一扫

专栏目录

bohu83 CSDN认证博客专家 CSDN认证企业博客

码龄17年

874: 原创

2万+: 周排名

31万+: 总排名

174万+: 访问

: 等级

2万+: 积分

989: 粉丝

410: 获赞

277: 评论

1900: 收藏

私信

关注

热门文章

分类专栏

在职学习 2篇
ES 63篇
PMP 45篇
数据库分库分表 16篇
python 40篇
NLP 76篇
推荐系统 1篇
leetcode 95篇
redis从入门到放弃 44篇
MYSQL 84篇
容器化 3篇
并发系列整理 43篇
支付系统 16篇
java 60篇
JVM 30篇
J2EE 27篇
nginx 1篇
RPC 8篇
算法 68篇
服务器 11篇
数据库 87篇
设计模式 4篇
分布式 38篇
网络 14篇
工作资料 57篇
随想 9篇
kafka 12篇
数学 15篇
财务 6篇

最新评论

《算法图解》-9动态规划背包问题，行程最优化
qq_63136240: 看要求，本类型背包问题属于0-1背包问题，即一类商品要么选一个要么不选，故指两个子背包，一个有该行物品的背包一个则代表没有改行的物品。至于子背包可能含有子背包的意思是：比如当我们把该行物品放入背包后，剩下的空间又相当于一个更小的背包（考虑是否放入另一个物品j（非本行）来分解成更小的子背包问题）我的理解，可能不对
Elasticsearch核心技术与实战学习笔记
一念花开一念花落: 你好： doc_count_error_upper_bound：4+3 请问是怎么来的，没有看懂
《程序员的数学：5 排列组合》
彩虹大喇叭: 为什么要除以2啊，最后，不是很理解
word2vec Skip-Gram和CBOW小白学习笔记
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7988951, 请多输出高质量博客, 帮助更多的人
北京联通烽火光猫+烽火HG680 不拆机破解
showma: 好办法

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。