【Pytorch实战(五)】实现MNIST手写体识别

最新推荐文章于 2024-02-02 10:51:06 发布

cc__cc__

最新推荐文章于 2024-02-02 10:51:06 发布

阅读量562

点赞数

分类专栏： pytorch 文章标签： pytorch 深度学习神经网络

本文链接：https://blog.csdn.net/cc__cc__/article/details/106178756

版权

pytorch 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

一、MNIST数据集

MNIST数据集地址http://yann.lecun.com/exdb/mnist/
该数据集包含6w张训练集图片和1w张测试集图片

二、实现MNIST手写体识别

1.借助torchvision下载数据集

train_dataset = torchvision.datasets.MNIST(root='./data', train=True,
                                           transform=torchvision.transforms.ToTensor(), download=True) # 下载训练集
test_dataset = torchvision.datasets.MNIST(root='./data', train=False,
                                          transform=torchvision.transforms.ToTensor(), download=True) # 下载测试集

其中transform=torchvision.transforms.ToTensor()将数据转换为张量

2.借助DataLoader加载数据集

batch_size = 100  # 每批加载100条数据

train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=False)  # 不打乱顺序
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

3.训练模型并保存权重文件

fc = torch.nn.Linear(28 * 28, 10) # 数据集图片大小为28*28；10对应0-9这种结果
L = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(fc.parameters(), lr=0.001)

num_epoch = 5
for epoch in range(num_epoch):
    for idx, (images, labels) in enumerate(train_loader):
        x = images.reshape(-1, 28*28)

        optimizer.zero_grad()
        preds = fc(x)
        loss = L(preds, labels)
        loss.backward()
        optimizer.step()

        if idx % 100 == 0:
            print('{} epochs, loss={}'.format(epoch, loss))

torch.save(fc.state_dict(), './mnist_model.pth')

这里并未使用CNN网络，只借助torch.nn.Linear构造简单的模型

4.测试准确率

correct = 0
total = 0
fc.load_state_dict(torch.load('./mnist_model.pth'))
for images, labels in test_loader:
    x = images.reshape(-1, 28*28)
    preds = fc(x)
    predicted = torch.argmax(preds, 1)  # 最大值索引正好对应于0-9预测值
    total += labels.size(0)
    correct += (predicted==labels).sum().item()

accuracy = correct / total
print('correct={},total={},accuracy={:.1%}'.format(correct, total, accuracy))

因为这里的模型比较简单，最终准确率约为92.2%。

若需借助CNN则可参照如下代码搭建卷积神经网络：

class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        self.conv0 = nn.Conv2d(1, 64, kernel_size=3, padding=1)
        self.relu1 = nn.ReLU()
        self.conv2 = nn.Conv2d(64, 128, kernel_size=3, padding=1)
        self.relu3 = nn.ReLU()
        self.pool4 = nn.MaxPool2d(stride=2, kernel_size=2)
        self.fc5 = nn.Linear(128 * 14 * 14, 1024)
        self.relu6 = nn.ReLU()
        self.dropout7 = nn.Dropout(p=0.5)
        self.fc8 = nn.Linear(1024, 10)

    def forward(self, x):
        x = self.conv0(x)
        x = self.relu1(x)
        x = self.conv2(x)
        x = self.relu3(x)
        x = self.pool4(x)
        x = x.view(-1, 128 * 14 * 14)
        x = self.fc5(x)
        x = self.relu6(x)
        x = self.dropout7(x)
        x = self.fc8(x)

        return x

cc__cc__

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【Pytorch实战(五)】实现MNIST手写体识别

一、MNIST数据集MNIST数据集地址http://yann.lecun.com/exdb/mnist/该数据集包含6w张训练集图片和1w张测试集图片二、实现MNIST手写体识别1.借助torchvision下载数据集train_dataset = torchvision.datasets.MNIST(root='./data', train=True, transform=torchvision.tran
复制链接

扫一扫

专栏目录