Deep Residual Learning for Image Recognition (ResNet)

最新推荐文章于 2024-06-22 16:12:05 发布

qq_35962437

最新推荐文章于 2024-06-22 16:12:05 发布

阅读量94

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_35962437/article/details/118728281

版权

深度学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

译文：https://www.jianshu.com/p/f71ba99157c7
文中将identity mapping翻译为自身映射，个人认为翻译为恒等映射更准确，即 $f (x) = x$ 。

ResNet，残差网络。

在叠加网络深度的时候，会暴露出退化问题：随着神经网络深度的增加，准确度趋近于饱和，然后迅速下降。这种退化问题并不是过拟合导致的。

作者提出了一个猜想：从一个训练好的浅层网络中，插入一些恒等变换层。即插入的层不改变输入，输出等于输入。
在这里插入图片描述
如图中下面的网络结构其实是上面网络结构加了最后一层，如果这个最后一层不改变输入，那么这两个网络其实是等价的。也就是说下面这个更深的网络的训练误差不会高于上面的浅层网络。

但实际上很难让机器学习到这样的一个恒等映射层。因此作者提出了残差学习框架。假设 $H (x)$ 是最优解函数，想要让 $H (x)$ 是一个恒等映射，即 $H (x) = x$ 。改为残差网络结构后，就变成了 $H (x) = f (x) + x = x$ ，即 $f (x) = 0$ ，只要让残差函数 $f (x)$ 是一个零映射，就可以实现让 $H (x)$ 是一个恒等映射。而让机器学习到零映射比让机器学习到恒等映射要简单的多。

于是作者提出了这样的网络结构
在这里插入图片描述
$f (x) + x$ 用一个shortcut实现，跳过一层或多层，将输入与输出叠加。这个shortcut既不会添加额外的参数，也不会增加计算复杂度。

这样的结构与“Highway Network”有些相似，但“Highway Network”的shortcut是有门控制的，这个门函数是数据相关的并且参数需要调整。如果门函数为0则shortcut无法使用，也就不再是残差结构。“Highway Network”并没有呈现出精度随深度增加而增加的特性。

将上述公式化表示，得到
在这里插入图片描述
其中 $F(x,{W_i})$ 表示将被训练的残差映射， $W_i$ 表示参数。该公式要求输入x和残差函数F的维度必须一致。如果不一致，可以在shortcut上增加一个线性投影 $W_s$ 来匹配维度

残差函数F即可以表示全连接层，也可以表示卷积层。同时，F可以表示一层或多层，但在表示一层时，函数F退化为参数矩阵 $W_i$ ，公式退化为 $y=W_ix+x$ 。作者并没有观察到这个公式具有任何优势。

qq_35962437

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Deep Residual Learning for Image Recognition (ResNet)

译文：https://www.jianshu.com/p/f71ba99157c7文中将identity mapping翻译为自身映射，个人认为翻译为恒等映射更准确，即f(x)=xf(x)=xf(x)=x。ResNet，残差网络。在叠加网络深度的时候，会暴露出退化问题：随着神经网络深度的增加，准确度趋近于饱和，然后迅速下降。这种退化问题并不是过拟合导致的。作者提出了一个猜想：从一个训练好的浅层网络中，插入一些恒等变换层。即插入的层不改变输入，输出等于输入。如图中下面的网络结构其实是上面网络结构加
复制链接

扫一扫