PyTorch学习(九)--Softmax Classifier

传送门:Softmax Classifier
说明: 1、softmax的输入不需要再做非线性变换,也就是说softmax之前不再需要激活函数(relu)。softmax两个作用,如果在进行softmax前的input有负数,通过指数变换,得到正数。所有类的概率求和为1。
2、y的标签编码方式是one-hot。我对one-hot的理解是只有一位是1,其他位为0。
3、多分类问题,标签y的类型是LongTensor。比如说0-9分类问题,如果y = torch.LongTensor([3]),对应的one-hot是[0,0,0,1,0,0,0,0,0,0]。
4、CrossEntropyLoss <==> LogSoftmax + NLLLoss 。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
代码说明:本模型为5层的全连接人工神经网络(ANN),目的是用Softmax进行分类,并没有用到CNN的模块(conv、pool等),因此在模型准确率到达一定限度之后,一种方法是需要加大训练次数Epoch,方可达到更高水平。

代码如下:

# -*- coding: UTF-8 -*-
'''===============================================
@Author :kidding
@Date   :2021/2/8 8:33
@File   :Multi_Classification
@IDE    :PyCharm
=================================================='''
import torch
import numpy as np
from torchvision import transforms
from torchvision import datasets
import torch.nn.functional as F
from torch.utils.data import DataLoader,Dataset
import matplotlib.pyplot as plt

'''
1、PrePare Dataset
'''
batch_size = 32
#transforms.ToTensor() 将一个PIL图像 转变为一个Tensor,像素值为[0,1]
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,(0.3081,))])
train_dataset = datasets.MNIST(root='./dataset/mnist',train=True,download=False,transform=transform)
train_loader = DataLoader(train_dataset,batch_size=batch_size,shuffle=True)

test_dataset =  datasets.MNIST(root='./dataset/mnist',train=False,download=False,transform=transform)
test_loader = DataLoader(test_dataset,batch_size=batch_size,shuffle=False)
'''
2、Design Model
'''
class Net(torch.nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        self.l1 = torch.nn.Linear(784,512)
        self.l2 = torch.nn.Linear(512,256)
        self.l3 = torch.nn.Linear(256,128)
        self.l4 = torch.nn.Linear(128,64)
        self.l5 = torch.nn.Linear(64,10)
        
    def forward(self,x):
        x = x.view(-1,784) #将其变为一个矩阵
        x = F.relu(self.l1(x))
        x = F.relu(self.l2(x))
        x = F.relu(self.l3(x))
        x = F.relu(self.l4(x))
        return self.l5(x) #最后一层不做RELU激活。
#实例化
model = Net()
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

'''
3、Construct loss and optimizer
'''
#定义一个损失函数,来计算我们模型输出的值和标准值的差距
criterion = torch.nn.CrossEntropyLoss()
#定义一个优化器,训练模型咋训练的,就靠这个,他会反向的更改相应层的权重
optimizer = torch.optim.SGD(model.parameters(),lr=0.01,momentum = 0.5)

'''
4、Training Cycle : forward-->backward-->update
'''
def train(epoch):
    running_loss = 0.0
    for batch_idx,data in enumerate(train_loader,0): #每次取一个样本
        inputs,target = data
        inputs, target = inputs.to(device), target.to(device)
        optimizer.zero_grad() #优化器清0
        #forward
        outputs = model(inputs)
        loss = criterion(outputs,target)
        # backeard 反向求梯度
        loss.backward()
        # update 更新权重
        optimizer.step()
        
        running_loss += loss.item() #把损失加起来
        # 每300次输出一下数据
        if batch_idx%300==299:
           # print('[%d,%5d] loss :%3f'%(epoch+1,batch_idx+1,running_loss/300))
            print("Epoch:",epoch+1,"batch_idx:",batch_idx+1,"Loss={:.3f}".format(running_loss/300))
            running_loss = 0.0
    return loss.item()

def test():
    correct = 0
    total = 0
    with torch.no_grad(): #测试不会计算梯度
        for data in test_loader:
            images,labels = data
            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            # 我们取概率最大的那个数作为输出
            _,predicted = torch.max(outputs.data,dim=1) #取出最大值的下标   "_,"为占位符,代表每行最大值的下标, dim = 1 列是第0个维度,行是第1个维度
            total += labels.size(0)
            # 计算正确率
            correct += (predicted == labels).sum().item() # 张量之间的比较运算

    print('Accuracy on Test_set :%d %%'%(100 * correct / total))
    return correct / total
'''
5、main
'''
if __name__=='__main__':
    epoch_list = []  # 保存epoch
    acc_list = []  # 保存每个epoch的准确率
    Loss_List = []  # 保存每个epoch对应的loss

    for epoch in range(20):
        loss = train(epoch)
        acc = test()

        epoch_list.append(epoch)
        acc_list.append(acc)
        Loss_List.append(loss)

    plt.plot(epoch_list, Loss_List)
    plt.ylabel('Loss')
    plt.xlabel('Epoch')
    plt.grid(ls='--')  # 生成网格
    plt.show()

    plt.plot(epoch_list, acc_list)
    plt.ylabel('accuracy')
    plt.xlabel('epoch')
    plt.grid(ls='--')  # 生成网格
    plt.show()

在训练10个Epoch的时候,Loss图像和Accuracy图像如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在训练20个Epoch的时候,Loss图像和Accuracy图像如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如上图所示,本模型定义的Loss输出格式为保留5位有效数字,因此,在第18个Epoch之后的Loss值为0.0,但实际上Loss值不是0.0。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值