pytorch.反向传播算法和优化器

在训练神经网络时,最常见的算法就是反向传播

为了支持反向传播,pytorch有一个内置的分类引擎,叫做TORCH.AUTOGRAD

import torch

x = torch.ones(5)  # input tensor
y = torch.zeros(3)  # expected output
w = torch.randn(5, 3, requires_grad=True)  # 如果需要反向传播就打开这个参数
b = torch.randn(3, requires_grad=True)  # 如果需要反向传播就打开这个参数
z = torch.matmul(x, w) + b
# print(f"x:{x}\ny:{y}\nw:{w}\nb:{b}\nz:{z}\n")

loss = torch.nn.functional.binary_cross_entropy_with_logits(z, y)
# print(loss)

print(f"Gradient function for z = {z.grad_fn}")
print(f"Gradient function for loss = {loss.grad_fn}")

loss.backward()
print(w.grad)
print(b.grad)

# 怎么样把反向传播的选项关掉呢,为什么要关掉,当我们训练好了网络,不在需要训练网络时,可以关掉
z = torch.matmul(x, w) + b
print(z.requires_grad)

with torch.no_grad():
    z = torch.matmul(x, w) + b
print(z.requires_grad)

# 也可以对tensor下手
z = torch.matmul(x, w) + b
z_det = z.detach()
print(z_det.requires_grad)

inp = torch.eye(5, requires_grad=True)
out = (inp+1).pow(2)
out.backward(torch.ones_like(inp), retain_graph=True)
print(f"First call\n{inp.grad}")
out.backward(torch.ones_like(inp), retain_graph=True)
print(f"\nSecond call\n{inp.grad}")
inp.grad.zero_()
out.backward(torch.ones_like(inp), retain_graph=True)
print(f"\nCall after zeroing gradients\n{inp.grad}")

我们首先需要创建一个神经网络,并导入一些训练数据

import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"Using {device} device")

training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor()
)

test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)

train_dataloader = DataLoader(training_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)


class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28 * 28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10),
        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits


model = NeuralNetwork().to(device)
print(model)

# 学习率
learning_rate = 1e-3
# 每次导入的数据量
batch_size = 64
# 训练轮数
epochs = 5

常见的损失函数包括nn.MSELoss(均方误差)

nn.NLLLoss(负对数,用于分类问题)

nn.CrossEntropyLoss(结合了softmax和NULLLoss)

优化器Optimizer

优化是每次训练过程中调整参数减小模型误差的过程,优化算法定义了这个过程是怎么进行的,我们使用梯度下降法

optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)

def train_loop(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    for batch, (X, y) in enumerate(dataloader):
        X = X.to(device)
        y = y.to(device)
        # Compute prediction and loss
        pred = model(X)
        loss = loss_fn(pred, y)

        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if batch % 100 == 0:
            loss, current = loss.item(), batch * len(X)
            print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")


def test_loop(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    test_loss, correct = 0, 0

    with torch.no_grad():
        for X, y in dataloader:
            X = X.to(device)
            y = y.to(device)
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()

    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100 * correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

# 损失函数
loss_fn = nn.CrossEntropyLoss()
# 优化器
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)

for t in range(epochs):
    print(f"Epoch {t + 1}\n-------------------------------")
    train_loop(train_dataloader, model, loss_fn, optimizer)
    test_loop(test_dataloader, model, loss_fn)
print("Done!")
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
反向传播算法深度学习的核心算法之一,它是用来计算神经网络参数的梯度,并根据梯度更新参数,从而实现模型的训练。 在PyTorch,实现反向传播算法的一般步骤如下: 1. 构建计算图:首先,需要定义神经网络模型,并将输入数据传递给模型进行前向计算,得到模型的输出结果。 2. 计算损失函数:根据模型的输出结果和标签数据,计算损失函数。PyTorch提供了一些常用的损失函数,如交叉熵损失函数、均方误差损失函数等,可以根据具体情况进行选择。 3. 计算梯度:通过调用损失函数的backward()方法,计算损失函数对每个参数的梯度。在计算梯度之前,需要将梯度清零,以避免之前的梯度对当前梯度的影响。 4. 参数更新:根据梯度信息和优化算法,更新模型的参数。PyTorch提供了一些常用的优化算法,如随机梯度下降、Adam等。 下面是一个简单的示例代码,实现了一个简单的全连接神经网络,并使用反向传播算法进行训练: ```python import torch import torch.nn as nn import torch.optim as optim # 定义网络模型 class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.fc1 = nn.Linear(10, 5) self.fc2 = nn.Linear(5, 1) def forward(self, x): x = torch.relu(self.fc1(x)) x = self.fc2(x) return x # 定义输入数据和标签数据 inputs = torch.randn(1, 10) labels = torch.randn(1, 1) # 定义损失函数和优化算法 net = Net() criterion = nn.MSELoss() optimizer = optim.SGD(net.parameters(), lr=0.01) # 计算模型输出和损失函数 outputs = net(inputs) loss = criterion(outputs, labels) # 计算梯度并更新参数 optimizer.zero_grad() loss.backward() optimizer.step() ``` 在上面的代码,首先定义了一个全连接神经网络模型,包含两个线性层。然后,定义了输入数据和标签数据。接着,定义了损失函数和优化算法,并将模型的参数传递给优化器。在每次训练迭代,计算模型的输出结果和损失函数,然后使用反向传播算法计算梯度,并使用优化算法更新模型的参数。 需要注意的是,PyTorch反向传播算法是自动求导的,即不需要手动计算梯度,只需要通过调用backward()方法即可。另外,在每次迭代,需要将梯度清零,否则会累加之前的梯度,导致结果不正确。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LyaJpunov

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值