深度学习模型--残差网络（ResNet）

Amy_bj

于 2024-04-04 14:00:00 发布

阅读量723

点赞数 13

分类专栏： AI大模型文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/Amy_bj/article/details/137342770

版权

AI大模型专栏收录该内容

21 篇文章 0 订阅

订阅专栏

本文详细解析了AI大模型学习中的理论基础，特别是残差网络（ResNet）的数学原理、算法和结构。ResNet通过残差块和跳跃连接解决了深度学习中的梯度问题，显著提升了图像识别性能，并引领了计算机视觉领域的进步。

摘要由CSDN通过智能技术生成

AI大模型学习

方向一：AI大模型学习的理论基础

提示：探讨AI大模型学习的数学基础、算法原理以及模型架构设计等。可以深入分析各种经典的深度学习模型，如卷积神经网络（CNN）、循环神经网络（RNN）以及Transformer等，并讨论它们在大规模数据处理中的优势与挑战。

残差网络（Residual Network，简称ResNet）是一种深度神经网络架构，由微软研究院的Kaiming He等人在2015年提出。ResNet通过引入了一种创新的“残差学习”（residual learning）技术来解决深度网络中的梯度消失和梯度爆炸问题，使得网络能够达到前所未有的深度，从而大幅提升了图像识别和分类的准确性。ResNet在2015年的ImageNet图像识别竞赛中大放异彩，赢得了多项第一名，标志着深度学习领域的一个重要进展。

残差学习的核心思想

残差网络的核心思想是引入“残差块”（residual block），使得网络可以学习输入与输出之间的残差（即差异）。在传统的神经网络中，每一层都直接学习输入到输出的映射；而在ResNet中，通过残差块使得层学习到的是输入与输出的差异，这样的设计可以更容易地传递梯度，因为即使更深的层没有学到有用的信息，网络也可以退化为恒等映射，保持性能不下降。

残差块的结构

一个典型的残差块包含两个3x3卷积层，每个卷积层后面跟着一个批量归一化（Batch Normalization）层和ReLU激活函数。最关键的是，在残差块的输入和输出之间有一个“快捷连接”（或称为“跳跃连接”），它将输入直接加到输出上。如果输入和输出的维度不一致，可以通过一个线性映射来调整维度，使之匹配。

ResNet的变体

从最初的ResNet开始，研究人员提出了多种变体来进一步改进性能或适应不同的应用需求，包括：

ResNet-50、ResNet-101和ResNet-152：这些变体的数字代表网络中残差块的数量。随着网络加深，模型的表现也相应提升，但同时计算成本也增加。
ResNeXt：通过引入“分组卷积”（grouped convolution），ResNeXt在增强模型表达能力的同时保持了参数的高效性。