《Deep Residual Learning for Image Recognition》残差网络 -- 解析笔记

最新推荐文章于 2022-04-04 12:10:32 发布

小刀丶

最新推荐文章于 2022-04-04 12:10:32 发布

阅读量495

点赞数 1

分类专栏： AI 论文文章标签：笔记残差 resnet 神经网络卷积

本文链接：https://blog.csdn.net/qq_34361099/article/details/89118074

版权

本文深入解析《Deep Residual Learning for Image Recognition》论文，揭示深度网络退化问题的原因，并介绍残差学习框架，通过学习改变量而非直接映射，解决了深度网络训练困难的问题。残差网络通过恒等映射增强线性变换能力，3层残差块结构（bottleneck）进一步节省计算资源。

摘要由CSDN通过智能技术生成

Deep Residual Learning for Image Recognition

概要
笔记
- 重点句子
- 下载链接

概要

原文链接

Deep Residual Learning for Image Recognition
作者：Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, Microsoft Research

内容概括

在这里插入图片描述

证明了模型退化问题：随着网络深度的增加，网络越来越难收敛，不是因为过拟合（56层网络训练集损失比20层的高，如图1）或梯度弥散和梯度爆炸问题（网络使用了BN），而是因为非线性激活函数的加入阻碍了线性变换的能力。

------------------------------------------------------------------------------------------------------------------- 在这里插入图片描述
2. 提出残差学习，让深度神经网络学习改变量。解释：设当前层张量为 $X$ ，理想的下一层的输出目标是 $H (x)$ ，那么原来的卷积层应该学习 $从 X 到 H (X)$ 的变换函数，而残差卷积块学习的是 $F (X) = H (X) - X$ ,即残差。换句话说就是普通的神经网络层学习如何从当前层变换到一下层，而残差层学习该如何在当前层的基础上小修小补使其变为下一层。

------------------------------------------------------------------------------------------------------------------- 在这里插入图片描述
3. 恒等映射：假设当前层的张量为 $X$ ,经过一层神经网络，我们希望它的输出还是 $X$ ，这就称为恒等映射。设当前层对应的映射函数为 $F (X)$ ，那么对于普通层应该做到对任意

最低0.47元/天解锁文章

小刀丶

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
《Deep Residual Learning for Image Recognition》残差网络 -- 解析笔记

Deep Residual Learning for Image Recognition概要原文链接内容概括生疏词汇笔记概要原文链接Deep Residual Learning for Image Recognition作者：Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, Microsoft Research内容概括生疏词汇词都不...
复制链接

扫一扫

专栏目录