PyTorch学习（十）--Basic CNN Model

最新推荐文章于 2024-03-29 07:30:04 发布

just kidding°

最新推荐文章于 2024-03-29 07:30:04 发布

阅读量312

点赞数

分类专栏： PyTorch学习文章标签：卷积网络深度学习 pytorch 神经网络

本文链接：https://blog.csdn.net/weixin_42296879/article/details/113757772

版权

PyTorch学习专栏收录该内容

12 篇文章 9 订阅

订阅专栏

传送门：Basic CNN Model
说明 1、每一个卷积核它的通道数量要求和输入通道是一样的。这种卷积核的总数有多少个和你输出通道的数量是一样的。
2、卷积(convolution)后，C(Channels)变，W(width)和H(Height)可变可不变，取决于是否padding。subsampling(或pooling)后，C不变，W和H变。
3、卷积层：保留图像的空间信息。
4、卷积层要求输入输出是四维张量(B,C,W,H)，全连接层的输入与输出都是二维张量(B,Input_feature)。
5、卷积(线性变换)，激活函数(非线性变换)，池化；这个过程若干次后，view打平，进入全连接层~
在这里插入图片描述

代码如下：

# -*- coding: UTF-8 -*-
'''===============================================
@Author ：kidding
@Date   ：2021/2/8 13:57
@File   ：Basic_CNN
@IDE    ：PyCharm
=================================================='''
import torch
import numpy as np
from torchvision import transforms
from torchvision import datasets
import torch.nn.functional as F
from torch.utils.data import DataLoader,Dataset
import matplotlib.pyplot as plt

'''
1、PrePare Dataset
'''
batch_size = 32
#transforms.ToTensor() 将一个PIL图像 转变为一个Tensor，像素值为[0,1]
transform = transforms.Compose([transforms.ToTensor(),
                               transforms.Normalize((0.1307,),(0.3081,))
                               ])
train_dataset = datasets.MNIST(root='./dataset/mnist',train=True,download=False,transform=transform)
train_loader = DataLoader(train_dataset,batch_size=batch_size,shuffle=True)

test_dataset =  datasets.MNIST(root='./dataset/mnist',train=False,download=False,transform=transform)
test_loader = DataLoader(test_dataset,batch_size=batch_size,shuffle=False)
'''
2、Design Model
'''
class Net(torch.nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        '''
        torch.nn.Conv2d(1,10,kernel_size=3,stride=2,bias=False)
        其中，1是指输入的Channel，灰色图像是1维的；10是指输出的Channel，也可以说第一个卷积层需要10个卷积核；
            kernel_size=3,卷积核大小是3x3；stride=2进行卷积运算时的步长，默认为1；
            bias=False卷积运算是否需要偏置bias，默认为False。padding = 0，卷积操作是否补0。
        '''
        self.conv1 = torch.nn.Conv2d(1,10,kernel_size=5)
        self.conv2 = torch.nn.Conv2d(10,20,kernel_size=5)
        self.pooling = torch.nn.MaxPool2d(2)
        self.fc = torch.nn.Linear(320,10)
        '''
        self.fc = torch.nn.Linear(320, 10)，这个320获取的方式，可以通过x = x.view(batch_size, -1) 
        #print(x.shape)可得到(batch,320)，320就是指要进行全连接操作时，输入的特征维度。
        '''

    def forward(self,x):
        #将输入图像（n,1,28,28）展平为 （n,784）
        batch_size = x.size(0) #求batch_size x.size(0)表示张量 x 的维度
        x = F.relu(self.pooling(self.conv1(x)))
        x = F.relu(self.pooling(self.conv2(x)))
        x = x.view(batch_size,-1) #展平操作
        x = self.fc(x) #最后一层不做RELU激活。
        return x

#实例化
model = Net()
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

'''
3、Construct loss and optimizer
'''
#定义一个损失函数，来计算我们模型输出的值和标准值的差距
criterion = torch.nn.CrossEntropyLoss()
#定义一个优化器，训练模型咋训练的，就靠这个，他会反向的更改相应层的权重
optimizer = torch.optim.SGD(model.parameters(),lr=0.01,momentum = 0.5)

'''
4、Training Cycle : forward-->backward-->update
'''
def train(epoch):
    running_loss = 0.0
    for batch_idx,data in enumerate(train_loader,0): #每次取一个样本
        inputs,target = data
        inputs, target = inputs.to(device), target.to(device)
        optimizer.zero_grad() #优化器清0

        #forward
        outputs = model(inputs)
        loss = criterion(outputs,target)

        # backeard 反向求梯度
        loss.backward()
        # update 更新权重
        optimizer.step()

        running_loss += loss.item() #把损失加起来
        # 每300次输出一下数据
        if batch_idx%300==299:
           # print('[%d,%5d] loss :%3f'%(epoch+1,batch_idx+1,running_loss/300))
            print("Epoch:",epoch+1,"batch_idx:",batch_idx+1,"Loss={:.3f}".format(running_loss/2000))
            running_loss = 0.0
    return loss.item()

def test():
    correct = 0
    total = 0
    with torch.no_grad(): #测试不会计算梯度
        for data in test_loader:
            images,labels = data
            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            # 我们取概率最大的那个数作为输出
            _,predicted = torch.max(outputs.data,dim=1) #取出最大值的下标   "_,"为占位符，代表每行最大值的下标， dim = 1 列是第0个维度，行是第1个维度
            total += labels.size(0)
            # 计算正确率
            correct += (predicted == labels).sum().item() # 张量之间的比较运算

    #print('Accuracy on Test_set :%d %%'%(100 * correct / total))
    print('Accuracy on test set: %d %% [%d/%d]' % (100 * correct / total, correct, total))
    return correct / total
'''
5、main
'''
if __name__=='__main__':
    epoch_list = []  # 保存epoch
    acc_list = []  # 保存每个epoch的准确率
    Loss_List = []  # 保存每个epoch对应的loss

    for epoch in range(20):
        loss = train(epoch)
        acc = test()

        epoch_list.append(epoch)
        acc_list.append(acc)
        Loss_List.append(loss)

    plt.plot(epoch_list, Loss_List)
    plt.ylabel('Loss')
    plt.xlabel('Epoch')
    plt.grid(ls='--')  # 生成网格
    plt.show()

    plt.plot(epoch_list, acc_list)
    plt.ylabel('accuracy')
    plt.xlabel('epoch')
    plt.grid(ls='--')  # 生成网格
    plt.show()

网络模型如下图：
在这里插入图片描述
对于基本的CNN，进行20轮的训练之后，Loss图像和Accuracy图像如下：

第10讲作业：传送门：Homework_CNN_Model

just kidding°

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
PyTorch学习（十）--Basic CNN Model

传送门：Basic CNN Model说明 1、每一个卷积核它的通道数量要求和输入通道是一样的。这种卷积核的总数有多少个和你输出通道的数量是一样的。2、卷积(convolution)后，C(Channels)变，W(width)和H(Height)可变可不变，取决于是否padding。subsampling(或pooling)后，C不变，W和H变。3、卷积层：保留图像的空间信息。4、卷积层要求输入输出是四维张量(B,C,W,H)，全连接层的输入与输出都是二维张量(B,Input_feature)。
复制链接

扫一扫

专栏目录