4 Pytorch实例——使用全连接神经网络和GPU训练MNIST

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms

# 设备配置(如有GPU,则使用GPU进行加速)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# 定义超参数 Hyper-parameters 
input_size = 784
hidden_size = 500
num_classes = 10
num_epochs = 50
batch_size = 100
learning_rate = 0.001

# 加载MNIST数据集 
train_dataset = torchvision.datasets.MNIST(root='data', 
                                           train=True, 
                                           transform=transforms.ToTensor(),  
                                           download=True)

test_dataset = torchvision.datasets.MNIST(root='data', 
                                          train=False, 
                                          transform=transforms.ToTensor())

train_loader = torch.utils.data.DataLoader(dataset=train_dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset, 
                                          batch_size=batch_size, 
                                          shuffle=False)

# 全连接神经网络   使用一个隐层
class NeuralNet(nn.Module):
    def __init__(self, input_size, hidden_size, num_classes):
        super(NeuralNet, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size) 
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(hidden_size, num_classes)  
    
    def forward(self, x):
        out = self.fc1(x)
        out = self.relu(out)
        out = self.fc2(out)
        return out

model = NeuralNet(input_size, hidden_size, num_classes).to(device)

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)  

# 训练模型
total_step = len(train_loader)
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):  
        # 移动 tensors 至 GPU 中进行计算
        images = images.reshape(-1, 28*28).to(device)
        labels = labels.to(device)
        
        # 前向传递
        outputs = model(images)
        loss = criterion(outputs, labels)
        
        # 后向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}' 
                   .format(epoch+1, num_epochs, i+1, total_step, loss.item()))

# 测试模型
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        # 移动 tensors 至 GPU 中进行计算
        images = images.reshape(-1, 28*28).to(device)
        labels = labels.to(device)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total))

# 保存模型
torch.save(model.state_dict(), 'model.ckpt')

最终结果:98.52%

### 回答1: 卷积神经网络(Convolutional Neural Network,CNN)是一种常用于图像识别和计算机视觉任务的深度学习模型。在处理图像数据时,CNN能够通过一系列卷积层、池化层和全连接层等结构,从图像中提取出重要的特征,然后进行分类或其他相关任务。 FASHION MNIST是一个常用的图像分类数据集,包含了10个类别的衣服、鞋子和配饰等图像。PyTorch是一个流行的深度学习框架,封装了CNN模型训练和测试过程,非常适合处理FASHION MNIST数据集。 在PyTorch使用CNN训练FASHION MNIST数据集的代码如下所示: ```python import torch import torch.nn as nn import torch.optim as optim import torchvision.transforms as transforms from torch.utils.data import DataLoader from torchvision.datasets import FashionMNIST # 定义CNN模型 class CNN(nn.Module): def __init__(self): super(CNN, self).__init__() self.conv1 = nn.Conv2d(1, 32, 3) self.relu = nn.ReLU() self.maxpool = nn.MaxPool2d(2) self.conv2 = nn.Conv2d(32, 64, 3) self.fc1 = nn.Linear(64 * 5 * 5, 128) self.fc2 = nn.Linear(128, 10) def forward(self, x): out = self.conv1(x) out = self.relu(out) out = self.maxpool(out) out = self.conv2(out) out = self.relu(out) out = self.maxpool(out) out = out.view(out.size(0), -1) out = self.fc1(out) out = self.relu(out) out = self.fc2(out) return out # 数据预处理及加载 transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,)) ]) train_dataset = FashionMNIST(root='./data', train=True, download=True, transform=transform) test_dataset = FashionMNIST(root='./data', train=False, download=True, transform=transform) train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True) test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False) # 模型训练 model = CNN() criterion = nn.CrossEntropyLoss() optimizer = optim.Adam(model.parameters(), lr=0.001) device = torch.device("cuda" if torch.cuda.is_available() else "cpu") model.to(device) for epoch in range(10): model.train() for images, labels in train_loader: images, labels = images.to(device), labels.to(device) optimizer.zero_grad() outputs = model(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() model.eval() with torch.no_grad(): correct = 0 total = 0 for images, labels in test_loader: images, labels = images.to(device), labels.to(device) outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() accuracy = correct / total print(f'Epoch {epoch+1}, Accuracy: {accuracy:.2f}') ``` 这段代码首先定义了一个CNN模型,包含了两个卷积层和两个全连接层。然后进行了数据预处理和加载,将数据集分为训练集和测试集,并创建了对应的数据加载器。接着定义了损失函数和优化器。在训练过程中,将模型逐渐迁移到GPU上,并使用Adam优化算法对模型进行优化。最后,在每个epoch结束时,计算并打印出测试集的准确率。 通过运行这段代码,我们可以训练一个CNN模型,用于对FASHION MNIST数据集进行分类任务。这样就可以实现对图像数据进行分类的功能。 ### 回答2: Fashion MNIST是一个经典的图像分类数据集,由衣物图像组成,共有10个类别。卷积神经网络是一种广泛用于图像识别任务的神经网络模型PyTorch是一种较为流行的深度学习框架,可以用于实现卷积神经网络。 在PyTorch中,可以使用torchvision库来加载Fashion MNIST数据集,该库提供了方便的接口。 首先,需要导入所需的库: import torch import torchvision import torch.nn as nn import torchvision.transforms as transforms 然后,定义网络模型,可以使用torch.nn模块来定义网络的结构,如卷积层、池化层和全连接层等。 class CNN(nn.Module): def __init__(self): super(CNN, self).__init__() self.conv1 = nn.Conv2d(1, 16, kernel_size=5) self.pool = nn.MaxPool2d(kernel_size=2, stride=2) self.conv2 = nn.Conv2d(16, 32, kernel_size=5) self.fc = nn.Linear(32 * 4 * 4, 10) def forward(self, x): x = self.pool(F.relu(self.conv1(x))) x = self.pool(F.relu(self.conv2(x))) x = x.view(-1, 32 * 4 * 4) x = self.fc(x) return x 接下来,需要加载数据集并对其进行预处理: train_dataset = torchvision.datasets.FashionMNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True) test_dataset = torchvision.datasets.FashionMNIST(root='./data', train=False, transform=transforms.ToTensor()) 然后,定义一个数据加载器来批量加载数据: train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=100, shuffle=True) test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=100, shuffle=False) 接着,实例化网络模型并定义损失函数和优化器: model = CNN() criterion = nn.CrossEntropyLoss() optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9) 最后,进行模型训练和测试: for epoch in range(10): # 迭代10次 # 训练 for i, (images, labels) in enumerate(train_loader): optimizer.zero_grad() outputs = model(images) loss = criterion(outputs, labels) loss.backward() optimizer.step() if i % 100 == 0: print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, 10, i+1, len(train_loader), loss.item())) # 测试 correct = 0 total = 0 with torch.no_grad(): for images, labels in test_loader: outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total)) 这是一个简单的使用PyTorch实现Fashion MNIST分类的卷积神经网络的代码。其核心步骤包括定义网络模型、加载数据集、定义损失函数和优化器、进行模型训练和测试。 ### 回答3: 卷积神经网络是一种常用的深度学习模型,可以用于图像分类任务。在PyTorch中,可以使用Fashion-MNIST数据集来训练和测试一个卷积神经网络模型。 首先,我们需要导入所需要的库和模块。在PyTorch中,可以使用torchvision库来加载和预处理Fashion-MNIST数据集,使用torch.nn模块来构建卷积神经网络模型。 接下来,我们需要定义卷积神经网络模型的结构。可以使用torch.nn模块中的Conv2d和MaxPool2d等函数来定义卷积层和池化层,使用torch.nn.functional模块中的relu函数来定义激活函数。在Fashion-MNIST数据集中,输入图像是灰度图像,所以卷积神经网络模型的输入通道数为1。 然后,我们需要定义训练和测试函数。在训练函数中,我们可以使用torch.optim模块中的Adam优化器来更新模型的参数,使用torch.nn.functional模块中的交叉熵函数来计算损失。在测试函数中,我们可以使用torch.max函数来获取模型输出的类别,并与真实标签进行比较,从而计算模型的准确率。 最后,我们可以使用torchvision库中的transforms来对训练和测试数据集进行预处理,使用torch.utils.data和torch.utils.data.Dataloader来加载和处理数据集,以及使用torchvision库中的datasets函数来加载Fashion-MNIST数据集。 通过以上步骤,我们可以得到一个完整的卷积神经网络模型训练和测试代码。即通过搭建卷积神经网络模型的结构,定义训练和测试函数,以及加载和处理数据集。然后,我们可以使用Fashion-MNIST数据集来训练和测试该模型。通过迭代调整模型的参数,我们可以得到一个准确率较高的卷积神经网络模型,用于Fashion-MNIST数据集的图像分类任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

钱彬 (Qian Bin)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值