【Pytorch】 Pytorch实例:单层神经网络实现

一般神经网络的训练包括几个重要的步骤,数据准备、初始化权重、激活函数、前向计算、损失函数、计算损失、反向计算、更新参数,直到收敛或达到终止条件。
本篇介绍神经网络在iris数据集上完成多分类的任务。

程序头引入必要的包

import torch
import torch.nn.functional as F

from sklearn.datasets import load_iris
from torch.autograd import Variable
from torch.optim import SGD

动态地判断GPU是否可用,方便在不同类型的处理器上迁移。

use_CUDA = torch.cuda.is_available()

加载数据集,sklearn中有iris的数据集,在这里只要加载就可以使用了:

iris = load_iris()
# dict_keys(['target_names' , 'data', 'feature_names', 'DESCR', 'target'])

数据预处理,包括从数据集里区分输入/输出,最后把输入/输出数据封装成pytorch期望的Variable格式:

x = iris['data']
y = iris['target']
# x.shape (150,4)
# y.shape (150,)

x = torch.FloatTensor(x)
y = torch.LongTensor(y)
x, y = Variable(x), Variable(y)

神经网络模型定义,pytorch中自定义的模型都需要

好的,首先我们可以使用PyTorch搭建一个基于循环神经网络的手写数字识别模型。下面是一个简单的代码示例: ```python import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, transforms # 定义超参数 batch_size = 64 learning_rate = 0.01 epochs = 10 # 加载MNIST数据集 train_dataset = datasets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True) test_dataset = datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor()) # 定义数据加载器 train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True) test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False) # 定义循环神经网络模型 class RNN(nn.Module): def __init__(self, input_size, hidden_size, num_classes): super(RNN, self).__init__() self.hidden_size = hidden_size self.rnn = nn.RNN(input_size, hidden_size, batch_first=True) self.fc = nn.Linear(hidden_size, num_classes) def forward(self, x): h0 = torch.zeros(1, x.size(0), self.hidden_size).to(device) out, _ = self.rnn(x, h0) out = self.fc(out[:, -1, :]) return out # 定义设备 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') # 实例化模型并移动到设备上 model = RNN(input_size=28, hidden_size=128, num_classes=10).to(device) # 定义损失函数和优化器 criterion = nn.CrossEntropyLoss() optimizer = optim.Adam(model.parameters(), lr=learning_rate) # 训练模型 for epoch in range(epochs): for i, (images, labels) in enumerate(train_loader): # 将数据移动到设备上 images = images.reshape(-1, 28, 28).to(device) labels = labels.to(device) # 前向传播 outputs = model(images) loss = criterion(outputs, labels) # 反向传播和优化 optimizer.zero_grad() loss.backward() optimizer.step() # 每100个批次打印一次训练信息 if (i+1) % 100 == 0: print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, i+1, len(train_loader), loss.item())) # 测试模型 model.eval() with torch.no_grad(): correct = 0 total = 0 for images, labels in test_loader: # 将数据移动到设备上 images = images.reshape(-1, 28, 28).to(device) labels = labels.to(device) # 前向传播 outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print('Test Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total)) ``` 在这个例子中,我们使用了一个单层的循环神经网络(RNN),它接受28x28像素的图像作为输入,并输出10个数字类别的概率分布。我们使用了交叉熵损失函数和Adam优化器进行训练,并在测试集上评估了模型的准确率。 希望这个简单的例子能够帮助你理解如何使用PyTorch实现基于循环神经网络的手写数字识别模型。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值