用pytorch实现简单模型的搭建，数据集的加载，以及网络的训练

博客都是给自己看的笔记，如有误导深表抱歉

已于 2023-03-19 19:32:25 修改

阅读量484

点赞数

分类专栏：网络搭建文章标签： pytorch 深度学习人工智能

于 2023-03-17 16:35:47 首次发布

本文链接：https://blog.csdn.net/weixin_50752408/article/details/129623312

版权

网络搭建专栏收录该内容

5 篇文章 0 订阅

订阅专栏

首先，让我们导入 PyTorch 库和其他必要的库：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader

nn库：nn库是PyTorch中的神经网络库，主要用于搭建深度学习模型。它提供了很多常用的层（如全连接层、卷积层、池化层等）和激活函数（如ReLU、sigmoid、tanh等），以及一些常用的损失函数（如交叉熵损失、均方误差损失等）等，使得用户可以方便地构建自己的神经网络模型。

optim库：optim库是PyTorch中的优化算法库，主要用于深度学习中的参数优化。它提供了一系列的优化器，可以用于训练神经网络。

dataloader库：dataloader库是PyTorch中用于数据加载和批量处理的库，主要用于处理大规模数据集的输入。它提供了一种灵活而高效的数据加载方法，可以方便地对数据进行预处理、批量处理、乱序等操作，同时可以在训练过程中实现并行化处理，从而加速数据加载和训练。

模型搭建

在 PyTorch 中，我们可以通过继承 nn.Module 类来定义模型。我们需要实现模型的前向传递（forward）函数，该函数接受输入数据并返回输出结果。

nn.Module 类：nn.Module 是 PyTorch 中的一个重要类，它是所有神经网络模型的基类，定义了神经网络的基本组成部分。nn.Module 的核心功能是提供参数管理功能，使得参数的初始化、保存和加载等操作变得更加容易和方便。通过继承 nn.Module 类，可以自定义神经网络模型。在子类中需要实现 __init__() 和 forward() 两个方法。其中 __init__() 方法定义模型结构，forward() 方法定义模型计算流程。同时，可以在子类中定义其他的方法和属性，如 loss_fn、optimizer 等。

以下是一个简单的例子：

class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(128, 10)
        
    def forward(self, x):
        x = x.view(-1, 784)
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

在上面的例子中，我们定义了一个包含两个全连接层的模型。在 __init__ 方法中，我们定义了模型中的各个层。在 forward 方法中，我们首先将输入的张量 x 重塑为一个大小为 (batch_size, 784) 的张量，然后通过两个全连接层和一个 ReLU 激活函数实现前向传递。最后，我们返回模型的输出结果。

数据集加载

在 PyTorch 中，我们可以使用 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 类来加载数据集。我们需要继承 Dataset 类并实现 __len__ 和 __getitem__ 方法来定义我们的数据集。以下是一个简单的例子：

class MyDataset(torch.utils.data.Dataset):
    def __init__(self, X, y):
        self.X = X
        self.y = y
        
    def __len__(self):
        return len(self.X)
    
    def __getitem__(self, index):
        return self.X[index], self.y[index]

在上面的例子中，我们定义了一个包含输入数据和标签的数据集。在 __len__ 方法中，我们返回数据集的长度。在 __getitem__ 方法中，我们根据索引 index 返回数据集中的一个样本。

然后，我们可以使用 DataLoader 类来创建批次数据。以下是一个简单的例子：

dataset = MyDataset(X_train, y_train)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

在上面的例子中，我们使用 MyDataset 类创建数据集，然后使用 DataLoader 类创建一个批次数据加载器。我们可以指定批次大小、是否打乱数据等参数。

网络训练

在 PyTorch 中，我们可以使用优化器（optimizer）和损失函数（loss function）来训练模型。以下是一个简单的例子：

model = MyModel()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

for epoch in range(num_epochs):
    for inputs, labels in dataloader:
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

在上面的例子中，我们首先定义了模型、损失函数和优化器。在每个 epoch 中，我们遍历数据集中的每个批次数据，对模型进行训练。对于每个批次数据，我们首先将梯度清零，然后计算模型的输出结果。接着，我们计算损失函数并进行反向传播，最后通过优化器更新模型的参数。

在训练过程中，我们还可以添加一些其他的操作，例如计算模型在验证集上的准确率、调整学习率等。具体实现方式可以根据任务的需要进行调整。

最后，我们可以保存训练好的模型，以便在测试集上进行评估或者在生产环境中使用。以下是一个简单的例子：

torch.save(model.state_dict(), 'model.pth')

在上面的例子中，我们使用 state_dict 方法保存模型的参数。我们可以将保存的文件命名为 model.pth 或其他名称。在加载模型时，我们可以使用 load_state_dict 方法加载模型的参数：

model = MyModel()
model.load_state_dict(torch.load('model.pth'))

在上面的例子中，我们首先创建一个新的模型 MyModel，然后使用 load_state_dict 方法加载保存的参数。

除了上述提到的模型搭建、数据集加载和网络训练之外，还有一些常用的操作可以帮助我们更好地完成深度学习任务，包括模型评估、可视化、迁移学习等等。

1.模型评估

在训练模型之后，我们需要评估模型在测试集上的性能。通常使用准确率、召回率、F1 值等指标来评估模型的性能。在 PyTorch 中，我们可以使用以下代码计算模型在测试集上的准确率：

correct = 0  # 初始化预测正确的样本数为0
total = 0  # 初始化测试集的总样本数为0

# 使用with torch.no_grad()来关闭梯度计算，从而减少内存消耗
with torch.no_grad():
    # 对测试集中的每个样本进行预测
    for inputs, labels in testloader:
        outputs = model(inputs)  # 将输入数据输入模型，得到输出
        _, predicted = torch.max(outputs.data, 1)  # 选取输出中的最大值作为预测结果
        total += labels.size(0)  # 累加测试集的总样本数
        correct += (predicted == labels).sum().item()  # 累加预测正确的样本数

# 计算准确率并打印结果
accuracy = 100 * correct / total
print('Accuracy: %.2f%%' % accuracy)

在上述代码中，我们首先使用 torch.no_grad() 上下文管理器关闭梯度计算。然后对测试集进行遍历，计算模型在每个批次数据上的输出结果，并通过 torch.max() 方法计算预测结果。接着，我们计算模型在测试集上的准确率。

2.可视化

在深度学习中，可视化可以帮助我们更好地理解模型的运作，以及数据的分布和变化。在 PyTorch 中，我们可以使用 TensorBoard 来进行可视化。以下是一个简单的例子：

from torch.utils.tensorboard import SummaryWriter

# 创建一个SummaryWriter对象，指定存放日志文件的目录为logs
writer = SummaryWriter('logs')

for epoch in range(num_epochs):
    # 在训练集上训练模型
    # ...

    # 在验证集上评估模型性能，并计算损失和准确率
    # ...

    # 将训练集和验证集的损失和准确率写入TensorBoard日志文件中
    writer.add_scalar('Loss/train', train_loss, epoch)  # 写入训练集上的损失
    writer.add_scalar('Loss/val', val_loss, epoch)  # 写入验证集上的损失
    writer.add_scalar('Accuracy/train', train_acc, epoch)  # 写入训练集上的准确率
    writer.add_scalar('Accuracy/val', val_acc, epoch)  # 写入验证集上的准确率

# 关闭SummaryWriter对象
writer.close()

在上述代码中，我们首先创建一个 SummaryWriter 对象，并指定保存日志文件的路径。然后在每个 epoch 中，我们计算模型在验证集上的准确率，并使用 add_scalar 方法将训练和验证的损失和准确率写入日志文件。最后通过 close 方法关闭日志文件。