简单易懂的PyTorch版ResNet50复现代码

最新推荐文章于 2025-03-11 01:49:57 发布

hlld26

最新推荐文章于 2025-03-11 01:49:57 发布

阅读量8.8k

点赞数 6

分类专栏：深度学习

本文链接：https://blog.csdn.net/hlld__/article/details/113755368

版权

pytorch resnet bottleneck

本文详细介绍了ResNet50的网络结构，包括其Bottleneck卷积块的设计，并提供了使用PyTorch实现ResNet50的代码示例。网络开始于7x7卷积和最大池化，接着通过四个阶段的Bottleneck块，最后通过全局平均池化、Flatten和全连接层进行分类。Bottleneck块分为两种类型，一种用于通道数变化的情况，另一种则直接相加Shortcut。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ResNet50网络架构

ResNet50的网络解构相对简单，没有涉及到复杂的组件，大概50行代码就能复现。但我每次想用它的时候都会忘点东西，比如Bottleneck的结构如何实现，ResNet50的几个阶段各包含几个块等等，想着得写一篇文章记录下，免得以后又重复搬砖。ResNet50的网络结构如下，论文中网络的输入为 3x224x224，先经过步长为 2 填充为 3 的 7x7 卷积 + BN + ReLU和步长为 2 填充为 1 的 3x3 最大池化，接着经过4个阶段，每个阶段包含的 Bottleneck 卷积块分别为3、4、6、3，最后经过步长为 1 填充为 0 的 7x7 均值池化、Flatten 和输入为 2048 维，输出为 1000 维的全连接层，经过 Softmax 操作后得到网络的分类概率预测。
ResNet50结构

Bottleneck卷积块

Bottleneck卷积块是ResNet50核心的部分，ResNet50的每个阶段由若干Bottleneck组成，其中第一个Bottleneck的输入与输出通道数不一致，需要使用 1x1 卷积 + BN 映射 Shortcut 后相加，其余的Bottleneck则是直接将 Shortcut 进行相加。包含与不包含1x1映射的Bottleneck结构分别如下所示：

PyTorch复现代码

# ResNet50.py
import torch
import torch.nn as nn
import torch.nn.functional as F

class Conv(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size=1, stride=1,
                 padding=None, groups=1, activation=True):
        super(Conv, self).__init__()
        padding = kernel_size // 2 if padding is None else padding
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride,
                              padding, groups=groups, bias=False)
        self.bn = nn.BatchNorm2d(out_channels

最低0.47元/天解锁文章