残差网络理解

小桥流水---人工智能

于 2024-04-17 15:24:36 发布

阅读量443

点赞数 4

分类专栏：人工智能机器学习算法机器学习分类算法文章标签：机器学习人工智能深度学习

本文链接：https://blog.csdn.net/qlkaicx/article/details/137874624

版权

机器学习算法同时被 3 个专栏收录

278 篇文章 13 订阅

订阅专栏

人工智能

274 篇文章 3 订阅

订阅专栏

机器学习分类算法

82 篇文章 2 订阅

订阅专栏

看了知乎的一篇关于残差网络的文章，https://zhuanlan.zhihu.com/p/72679537，我想发表一点我自己的看法！

在这里插入图片描述

1.我对残差网络的理解

残差网络（ResNet）确实与传统的卷积神经网络（CNN）在结构上有所不同，主要在于其在网络侧面引入了恒等连接线，也称为残差连接或跳跃连接。尽管这种改变似乎与传统的直线结构相悖，但残差网络在精度和性能上通常优于传统的CNN，尤其是在处理深度神经网络时。
残差连接的主要目的是解决深度神经网络训练过程中的梯度消失和梯度爆炸问题。在传统的CNN中，输入数据通过一系列的层逐层传递，每个层都对数据进行线性变换和非线性变换。当网络层数加深时，梯度在反向传播过程中可能会逐渐减小甚至消失，导致网络难以训练。而残差连接允许网络跨层直接传递信息，使得梯度能够更直接地回流到前面的层，从而有效地缓解梯度消失问题。
在残差网络中，每个网络块（通常是两个或三个卷积层的组合）的输出不仅通过下一层进行传递，还通过恒等连接直接与前一个网络块的输入相加。这种相加操作形成了残差，即网络学习的不是完整的输出，而是输出与输入的差值。这种残差学习的方式使得网络更容易优化，因为网络只需要学习输入和输出之间的微小差异，而不是整个输出。
由于残差连接的存在，残差网络在训练过程中能够更快地收敛，并且通常能够达到更高的精度。此外，残差网络还具有更好的特征提取能力，因为它能够保留更多的原始输入信息，并通过跨层连接将这些信息传递给后面的层。
至于如何进行运算，残差网络的基本运算过程与传统CNN类似，包括卷积、激活函数、池化等操作。但不同之处在于，在每个网络块的输出处，除了进行常规的卷积操作外，还需要将输出与通过恒等连接传递过来的输入进行相加，形成残差。这个残差随后会经过激活函数，并继续在网络中传递。