Pytorch实现一个用于处理CIFAR数据集的卷积神经网络（CNN）类

MikingG

已于 2023-08-30 15:52:47 修改

阅读量82

点赞数

分类专栏：机器学习（Machine Learning）文章标签：深度学习人工智能机器学习

于 2023-08-30 15:52:23 首次发布

本文链接：https://blog.csdn.net/weixin_64123373/article/details/132253132

版权

机器学习（Machine Learning）专栏收录该内容

8 篇文章 0 订阅

订阅专栏

class CNNCifar(nn.Module):
    def __init__(self, args):
        super(CNNCifar, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, args.num_classes)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return F.log_softmax(x, dim=1)

CIFAR数据集通常包括CIFAR-10和CIFAR-100，其中CIFAR-10包含10个类别的彩色图像。这个网络结构由两个卷积层和三个全连接层组成。以下是每个部分的详细解释：

初始化部分 `init`：

self.conv1 = nn.Conv2d(3, 6, 5): 第一个卷积层，有3个输入通道（彩色图像），6个输出通道，和5x5的卷积核。
self.pool = nn.MaxPool2d(2, 2): 最大池化层，窗口大小为2x2。这个池化层在后面的卷积层之后重复使用。
self.conv2 = nn.Conv2d(6, 16, 5): 第二个卷积层，6个输入通道，16个输出通道，和5x5的卷积核。
self.fc1 = nn.Linear(16 * 5 * 5, 120): 第一个全连接层，有16 * 5 * 5个输入单元和120个输出单元。
self.fc2 = nn.Linear(120, 84): 第二个全连接层，有120个输入单元和84个输出单元。
self.fc3 = nn.Linear(84, args.num_classes): 第三个全连接层，有84个输入单元，输出单元数由args.num_classes确定（例如，CIFAR-10的类别数为10）。