刘二大人《Pytorch深度学习与实践》10卷积神经网络基础篇

最新推荐文章于 2024-04-17 16:02:51 发布

py学习小白

最新推荐文章于 2024-04-17 16:02:51 发布

阅读量569

点赞数

分类专栏：笔记文章标签： pytorch 深度学习 cnn

本文链接：https://blog.csdn.net/m0_58327216/article/details/122847027

版权

笔记专栏收录该内容

24 篇文章 9 订阅

订阅专栏

该博客介绍了一个使用PyTorch训练MNIST数据集的卷积神经网络模型的过程。首先，定义了数据预处理步骤，包括ToTensor和Normalize。然后，构建了一个包含两个卷积层和一个全连接层的简单CNN模型。训练过程中采用了SGD优化器和交叉熵损失函数。最后，展示了训练和测试过程中的准确率变化。

摘要由CSDN通过智能技术生成

代码如下

import torch
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import Dataset
import matplotlib.pyplot as plt

# 准备数据


# transform.Compose（转换操作包括），其中是个列表，所以会遍历该列表，并执行
# transform.ToTensor 输入模式为PIL Image 或 numpy.ndarray (形状为H x W x C)数据范围是[0, 255] ，转换到一个 Torch.FloatTensor，
# 其形状 (C x H x W) 在 [0.0, 1.0] 范围
# transform.Normalize 是指归一化操作，其中均值和方差为0.1307和0.3081

batch_size = 64
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])

train_set = datasets.MNIST(root='../dataset/minist', train=True, transform=transform, download=True)
train_loader = DataLoader(train_set, shuffle=True, batch_size=batch_size)
test_set = datasets.MNIST(root='../dataset/minist', train=False, transform=transform, download=True)
test_loader = DataLoader(test_set, shuffle=False, batch_size=batch_size)
epoch_list = []
accuracy_list = []


# 模型构建
class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)  # 输入通道为1，输出设置为10，卷积核设置为5*5
        self.conv2 = torch.nn.Conv2d(10, 20, kernel_size=5)
        self.pooling = torch.nn.MaxPool2d(2)  # 池化层设置为2*2
        self.fc = torch.nn.Linear(320, 10)  # 最后一个分类线性层需要将卷积池化后的结果输出为10维向量

    def forward(self, x):
        # (batch_size,channel,width,height)
        batch_size = x.size(0)  # 将批量大小数拿出来
        # 输入x经过一个卷积层，之后经历一个池化层，最后用relu激活
        x = F.relu(self.pooling(self.conv1(x)))
        # 先卷积生成（10,24,24），再池化成（10,12,12），再激活，输出概率值
        x = F.relu(self.pooling(self.conv2(x)))
        # 将（10,12,12）卷积生成（20,8,8），再池化成（20,4,4），即320个像素点
        x = x.view(batch_size, -1)
        # 将格式从（batch_size,C,H,W)转换成（batch_size,-1)，即（64,320）
        x = self.fc(x)
        # 输出对该图像中数字的识别概率
        return x  # 最后一层不用激活函数激活，因为会用到交叉熵函数


model = Net()
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")# 用显卡来算
model.to(device)
# 构建损失函数和优化器
criterion = torch.nn.CrossEntropyLoss()  # 选择交叉熵损失函数，那么就包括了softmax函数和NLLLoss过程，即最后一层不用激活函数激活
optimizer = optim.SGD(model.parameters(), lr=0.04, momentum=0.5)  # 增加了惯性冲量，有利于克服鞍点


# 训练循环（前向，反向以及更新）
def train(epoch):
    running_loss = 0.0
    # enumerate函数表示将遍历数据，并将其组成一个索引序列，0表示索引从0开始以元组形式返回索引序列中的值。
    for batch_index, data in enumerate(train_loader, 0):
        # 获得一个批次的数据和标签
        inputs, target = data
        inputs, target = inputs.to(device), target.to(device)
        # 之前的梯度清零
        optimizer.zero_grad()
        # 获得模型预测结果（64*10）
        outputs = model(inputs)
        # 交叉熵损失函数outputs(64*10)
        loss = criterion(outputs, target)

        loss.backward()
        optimizer.step()
        running_loss += loss.item()
        if batch_index % 300 == 299:
            print('[%d, %5d] loss: %.3f' % (epoch + 1, batch_index + 1, running_loss / 2000))
            running_loss = 0.0


def test():
    correct = 0
    total = 0
    # 测试阶段不存在反向传播，所以不需要进行梯度求导
    with torch.no_grad():
        for data in test_loader:
            inputs, targets = data
            inputs, targets = inputs.to(device), targets.to(device)
            outputs = model(inputs)
            # 列是0维，行是1维，即取1维条件下的最大输出值
            _, predicted = torch.max(outputs.data, dim=1)  # 由于torch.max返回的是最大值和索引值,predicted需要的是索引值，'_,'是最大值的位置
            total += targets.size(0)  # 将测试集中（N*1）的矩阵中，第0个元素进行取出，最后得到测试集的测试数目
            # 预测值和测试的真实值进行对比，如相等，则将其数据提取出来，并相加
            correct += (predicted == targets).sum().item()
    print('accuracy on test set: %d %%' % (100 * correct / total))
    return correct / total


if __name__ == '__main__':
    for epoch in range(10):
        train(epoch)
        acc = test()
        epoch_list.append(epoch)
        accuracy_list.append(acc)
    plt.plot(epoch_list, accuracy_list)
    plt.xlabel('epoch')
    plt.ylabel('Accuracy')
    plt.grid()
    plt.show()