ResNet: 残差网络

最新推荐文章于 2025-03-25 17:22:52 发布

Helloworld188888

最新推荐文章于 2025-03-25 17:22:52 发布

阅读量1.8k

点赞数 2

分类专栏：深度学习 Python pytorch 文章标签：网络深度学习神经网络

本文链接：https://blog.csdn.net/qq_24951479/article/details/130383094

版权

Python 同时被 3 个专栏收录

39 篇文章

订阅专栏

深度学习

37 篇文章

订阅专栏

pytorch

27 篇文章

订阅专栏

ResNet是一种深度学习模型，通过引入残差块解决了深度神经网络中的梯度消失和梯度爆炸问题，允许网络训练达到数百层。每个残差块包含两个卷积层和跨层连接，使得信息可以直接传递，提高了训练效率和准确性。文章还提供了ResNet的PyTorch实现代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ResNet: 残差网络

介绍

ResNet（Residual Network）是由微软亚洲研究院的何凯明等人在2015年提出的深度学习模型。ResNet采用残差学习的思想，通过在网络中添加跨层连接（shortcut connection）来解决深度神经网络训练过程中的梯度消失和梯度爆炸问题，使神经网络的训练深度可以达到数百层甚至上千层。

方法历史

在深度学习模型的发展历程中，人们发现随着网络深度的增加，模型的性能并不能一直提升，反而会出现性能下降的情况。这一现象被称为“退化问题”（Degradation Problem）。传统的深度学习网络的训练过程中，每一层的输入都是上一层的输出，因此每一层都需要学习到原始输入的信息，这就导致了信息的丢失和模型的性能下降。

为了解决这一问题，ResNet提出了残差学习的思想。残差学习的核心思想是：在训练过程中，学习网络的残差，即学习网络输出和输入之间的差异，而不是学习网络输出本身。这样可以有效地避免梯度消失和梯度爆炸问题，使得网络的训练深度可以达到数百层甚至上千层。

方法优点

ResNet的主要优点有：

可以训练非常深的神经网络，达到数百层甚至上千层。
在保持网络深度的同时，减少了网络参数的数量，降低了模型的复杂度。
在训练过程中，可以有效地避免梯度消失和梯度爆炸问题，提高了模型的训练效率和精度。

步骤详细

残差块

ResNet的基本单元是残差块（Residual Block），如下图所示：

残差块中包含两个卷积层和一个跨层连接。跨层连接将输入直接加到输出上，即 $y = F (x) + x$ ，其中 $F (x)$ 表示残差块中的卷积操作， $x$ 表示输入， $y$ 表示输出。

残差网络

ResNet的整个网络结构如下图所示：

ResNet由多个残差块组成，其中每个残差块包含多个卷积层和一个跨层连接。网络的最后一层是一个全连接层，用于输出分类结果。

PyTorch实现

下面是使用PyTorch实现ResNet的示例代码：

import torch
import torch.nn as nn
import torch.nn.functional as F

class ResidualBlock(nn.Module):
    def __init__(self, in_channels, out_channels, stride=1):
        super(ResidualBlock, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(out_channels)
        self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn2 = nn.BatchNorm2d(out_channels)
        self.shortcut = nn.Sequential()
        if stride != 1 or in_channels != out_channels:
            self.shortcut = nn.Sequential(
                nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride, bias=False),
                nn.BatchNorm2d(out_channels)
            )
        
    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.bn2(self.conv2(out))
        out += self.shortcut(x)
        out = F.relu(out)
        return out

class ResNet(nn.Module):
    def __init__(self, block, num_blocks, num_classes=10):
        super(ResNet, self).__init__()
        self.in_channels = 64
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1, bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.layer1 = self.make_layer(block, 64, num_blocks[0], stride=1)
        self.layer2 = self.make_layer(block, 128, num_blocks[1], stride=2)
        self.layer3 = self.make_layer(block, 256, num_blocks[2], stride=2)
        self.layer4 = self.make_layer(block, 512, num_blocks[3], stride=2)
        self.avg_pool = nn.AdaptiveAvgPool2d((1, 1))
        self.fc = nn.Linear(512, num_classes)
        
    def make_layer(self, block, out_channels, num_blocks, stride):
        strides = [stride] + [1] * (num_blocks - 1)
        layers = []
        for stride in strides:
            layers.append(block(self.in_channels, out_channels, stride))
            self.in_channels = out_channels
        return nn.Sequential(*layers)
        
    def forward(self, x):
        out = F.relu(self.bn1(self.conv1(x)))
        out = self.layer1(out)
        out = self.layer2(out)
        out = self.layer3(out)
        out = self.layer4(out)
        out = self.avg_pool(out)
        out = out.view(out.size(0), -1)
        out = self.fc(out)
        return out

def ResNet18():
    return ResNet(ResidualBlock, [2, 2, 2, 2])

def ResNet34():
    return ResNet(ResidualBlock, [3, 4, 6, 3])

def ResNet50():
    return ResNet(Bottleneck, [3, 4, 6, 3])

def ResNet101():
    return ResNet(Bottleneck, [3, 4, 23, 3])

def ResNet152():
    return ResNet(Bottleneck, [3, 8, 36, 3])