（十三）优化器_nn优化器-CSDN博客

本文链接：https://blog.csdn.net/qq_46093326/article/details/135705353

本文详细介绍了如何在PyTorch中使用torch.optim模块创建优化器，如SGD，以及如何执行step()方法进行参数更新和zero_grad()方法清零梯度。通过CIFAR10数据集的实例，展示了反向传播前后的梯度检查和随机梯度下降优化过程。

摘要由CSDN通过智能技术生成

1. torch.optim介绍

1.1 如何创建优化器

在这里插入图片描述

1.2 step（）方法和zero_grad（）方法

在这里插入图片描述

2.代码实战

from torch import nn, optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader


class My_Module(nn.Module):
    def __init__(self, *args, **kwargs) -> None:
        super().__init__(*args, **kwargs)
        self.seq = nn.Sequential(
            nn.Conv2d(in_channels=3, out_channels=32, kernel_size=5, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=32, kernel_size=5, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5, padding=2),
            nn.MaxPool2d(kernel_size=2),
            nn.Flatten(),
            nn.Linear(in_features=1024, out_features=64),
            nn.Linear(in_features=64, out_features=10)
        )

    def forward(self, x):
        output = self.seq(x)
        return output


my_module = My_Module()
loss = nn.CrossEntropyLoss()  # 定义损失函数
optimizer = optim.SGD(params=my_module.parameters(), lr=0.01)  # 定义优化器,采用随机梯度下降算法
test_dataset = datasets.CIFAR10(root="datasets", transform=transforms.ToTensor(), download=True)
test_dataloader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True, drop_last=False)
for data in test_dataloader:
    imgs, targets = data
    output = my_module(imgs)
    result_loss = loss(output, targets)
    optimizer.zero_grad()  # 将模型的上一轮梯度清零，防止对本轮梯度优化产生影响
    result_loss.backward()
    optimizer.step()  # 通过随机梯度下降算法优化模型的梯度