Pytorch之Optim(优化器)

使用优化器,接收损失函数的结果,并调整网络参数,完成反向传播

根据示例

optimizer = torch.optim.SGD(module.parameters(), lr=0.01, momentum=0.9)

然后根据提示,清空梯度>网络前传>计算损失>反向传播>优化网络参数

在运行区域引入库和之前的Module

if __name__ == '__main__':
    module = Module()
    loss = nn.CrossEntropyLoss()
    optimizer = torch.optim.SGD(module.parameters(), lr=0.01, momentum=0.9)

    running_loss = 0.0
    for imgs, targets in dataloader:
        optimizer.zero_grad()
        outputs = module(imgs)
        result_loss = loss(outputs, targets)
        result_loss.backward()
        optimizer.step()

        running_loss = running_loss + result_loss
    print(running_loss)

再因为优化器一般不只是优化一次,迭代完所有训练集只是完成了网络(对于该数据集)的一次优化,优化的次数就是俗称的epoch,一般都是在外面再写个循环完成迭代

if __name__ == '__main__':
    module = Module()
    loss = nn.CrossEntropyLoss()

    optimizer = torch.optim.SGD(module.parameters(), lr=0.01, momentum=0.9)

    for epoch in range(12):
        running_loss = 0.0
        for imgs, targets in dataloader:
            optimizer.zero_grad()
            outputs = module(imgs)
            result_loss = loss(outputs, targets)
            result_loss.backward()
            optimizer.step()

            running_loss = running_loss + result_loss
        print(running_loss)

运行获得以下结果

然后由于CPU实在是太慢,加入GPU

if __name__ == '__main__':
    module = Module()
    loss = nn.CrossEntropyLoss()
    if torch.cuda.is_available():
        module = module.cuda()
        loss = loss.cuda()
    optimizer = torch.optim.SGD(module.parameters(), lr=0.01, momentum=0.9)

    for epoch in range(12):
        running_loss = 0.0
        for imgs, targets in dataloader:
            if torch.cuda.is_available():
                imgs = imgs.cuda()
                targets = targets.cuda()
                
            optimizer.zero_grad()
            outputs = module(imgs)
            result_loss = loss(outputs, targets)
            result_loss.backward()
            optimizer.step()

            running_loss = running_loss + result_loss
        print(running_loss)

最后放一下完整的代码

import torch
import torchvision
from torch import nn
from torch.nn import Sequential, Conv2d, MaxPool2d, Flatten, Linear
from torch.utils.data import DataLoader

dataset = torchvision.datasets.CIFAR10("CIFAR10", train=False, transform=torchvision.transforms.ToTensor(),download=True)

dataloader = DataLoader(dataset, batch_size=1)


class Module(nn.Module):
    def __init__(self):
        super(Module, self).__init__()
        self.model = Sequential(
            Conv2d(3, 16, 5),
            MaxPool2d(2, 2),
            Conv2d(16, 32, 5),
            MaxPool2d(2, 2),
            Flatten(),  # 注意一下,线性层需要进行展平处理
            Linear(32*5*5, 120),
            Linear(120, 84),
            Linear(84, 10)
        )

    def forward(self, x):
        x = self.model(x)
        return x
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MrRoose

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值