MNIST MLP-Net pytorch

鸡蛋牛肉面

已于 2024-06-03 21:43:46 修改

阅读量329

点赞数 5

分类专栏： pytorch 文章标签： pytorch 深度学习人工智能

于 2024-05-25 11:27:41 首次发布

本文链接：https://blog.csdn.net/smithcgauss/article/details/139194768

版权

pytorch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. information

MNIST数据集有70,000张图片,其中训练集有60,000张,而测试集有10,000张.
数据集里的图片示例如下:

2. code

2.1 improt

import torch,torchvision
import torchvision.datasets,torch.utils.data
from tqdm.rich import trange

2.2 download datasets

train = torchvision.datasets.MNIST(
    root='./datasets/mnist',     #这里是下载训练集的文件夹
    download=True,               #True:需要下载; False:不下载
    train=True,                  #是训练集还是测试集; True为训练集, False为测试集
    transform=torchvision.transforms.Compose([
        torchvision.transforms.ToTensor(),
        torchvision.transforms.Normalize((0.1307,),(0.3081,))
    ])
)
test = torchvision.datasets.MNIST(
    root='./datasets/mnist',     #这里是下载测试集的文件夹
    download=True,               #True:需要下载; False:不下载
    train=False,                 #是训练集还是测试集; True为训练集, False为测试集
    transform=torchvision.transforms.Compose([
        torchvision.transforms.ToTensor(),
        torchvision.transforms.Normalize((0.1307,),(0.3081,))
    ])
)

2.3 load datasets

train_loader = torch.utils.data.DataLoader(
    train,
    batch_size=60,    #每一批的图片为60张
    shuffle=True      #设置为随机打乱
)
test_loader = torch.utils.data.DataLoader(
    test,
    batch_size=60,    #每一批的图片为60张
    shuffle=True      #设置为随机打乱
)

2.4 create model of multi-classification

class NET(torch.nn.Module):
    def __init__(self):
        super(NET,self).__init__()
        self.model = torch.nn.Sequential(
            torch.nn.Linear(28*28,1000),
            torch.nn.ReLU(),
            torch.nn.Linear(1000,1000),
            torch.nn.ReLU(),
            torch.nn.Linear(1000,500),
            torch.nn.ReLU(),
            torch.nn.Linear(500,10),
            torch.nn.ReLU()
        )
    def forward(self,x):
        x = self.model(x)
        return x

2.5 train and evaluation

device = torch.device('cuda:0')   #使用GPU加速
num_epochs = 10    #训练次数
model = NET().to(device)   #使用GPU加速
loss = torch.nn.CrossEntropyLoss().to(device)  #使用GPU加速
optimizer = torch.optim.SGD(model.parameters(),lr=0.001)
correct = 0

for epoch in trange(num_epochs):
    for batch_index,(data,label) in enumerate(train_loader):
        data,label = data.to(device),label.cuda()   #使用GPU加速
        data = data.view(-1,28*28) #将图片数据打平,由28*28转为1*784
        predictions = model(data)
        crossentropyloss = loss(predictions,label) #计算交叉熵损失函数
        optimizer.zero_grad() #将梯度数据变零
        crossentropyloss.backward() #计算梯度
        optimizer.step() #更新权值系数
        
    for (data,target) in test_loader:
        data,target = data.to(device),target.cuda()  #使用GPU加速
        data = data.view(-1,28*28)  #将图片打平
        predicted = model(data)
        predicted = torch.argmax(predicted,dim=1) #得到每行最大数的索引
        compare = torch.eq(predicted,target)  #比较2个张量
        correct += torch.sum(compare).item()/len(target)
    correct /= len(test_loader) #计算正确率
    
print('correct:{:.1f}%'.format(correct*100))

3. theory

3.1 Cross-Entropy Loss Function

假设真实的概率为
$P=[p_1,p_2,p_3,\cdots ,p_{10}]$
而预测的概率为
$Q=[q_1,q_2,q_3,\cdots ,q_{10}]$
交叉熵计算为
$H=\sum_{i=1}^{10}p_ilog\frac{1}{q_i}$
在pytorch中,先会将预测值经过softmax-log,然后得出Q.