卷积神经网络 - ResNet（残差网络）

谦亨有终

已于 2025-03-27 10:17:14 修改

阅读量1.6k

点赞数 25

分类专栏： AI学习笔记文章标签： cnn 网络人工智能深度学习神经网络机器学习

于 2025-03-26 14:00:00 首次发布

本文链接：https://blog.csdn.net/liruiqiang05/article/details/146510883

版权

121 篇文章

订阅专栏

残差网络(Residual Network，ResNet)通过给非线性的卷积层增加直连边 (Shortcut Connection)(也称为残差连接(Residual Connection))的方式来提高信息的传播效率。

这是一种特殊的深度神经网络结构，由 Kaiming He 等人在 2015 年提出，目的是解决深层网络训练中出现的退化问题和梯度消失问题。

假设在一个深度网络中，我们期望一个非线性单元(可以为一层或多层的卷积层)𝑓(𝒙; 𝜃) 去逼近一个目标函数为 h(𝒙)。如果将目标函数拆分成两部分:恒等函数(Identity Function)𝒙 和残差函数(Residue Function)h(𝒙) − 𝒙。

根据通用近似定理，一个由神经网络构成的非线性单元有足够的能力来近似逼近原始目标函数或残差函数，但实际中后者更容易学习。因此，原来的优化问题可以转换为:让非线性单元 𝑓(𝒙; 𝜃) 去近似残差函数 h(𝒙) − 𝒙，并用 𝑓(𝒙; 𝜃) + 𝒙 去逼近 h(𝒙)。

下图给出了一个典型的残差单元示例。残差单元由多个级联的(等宽)卷积层和一个跨层的直连边组成，再经过 ReLU 激活后得到输出：

残差网络就是将很多个残差单元串联起来构成的一个非常深的网络。

接下来，我们从其核心概念、设计思想和举例说明：

深层网络的难题
随着网络层数加深，传统网络往往难以训练，原因在于：
- 梯度在反向传播中逐渐变小（梯度消失），导致前面层更新缓慢。
- 层数过深时，网络容易出现“退化”问题，即即使加深网络，训练误差也可能反而增大。
残差学习（Residual Learning）
ResNet 的核心思想是让网络学习“残差函数”，而不是直接学习原始映射。设原始目标映射为 H(x)（输入 x 到输出之间的映射），传统网络直接逼近 H(x)。而在残差网络中，设计层（即残差块）学习一个残差函数 F(x)=H(x)−x，因此原始映射可以表示为
H(x)=F(x)+x.
这种“快捷连接”（skip connection）直接将输入 x 加到输出上，帮助梯度直接传递，使得更深的网络也能有效训练。