计算机视觉学习笔记(四)---卷积神经网络之手写数字识别


前言

  本文承接pytorch学习笔记(三),以波士顿房价预测为例演示利用pytorch搭建一个简单的传统神经网络


一、读入数据进行数据预处理

  数据集为MNIST手写数字数据集,从torchvision 中导入数据。输入图像的总尺寸为28*28。

# 定义超参数 
input_size = 28  #图像的总尺寸28*28
num_classes = 10  #标签的种类数
num_epochs = 3  #训练的总循环周期
batch_size = 64  #一个撮(批次)的大小,64张图片

# 训练集
train_dataset = datasets.MNIST(root='./data',  
                            train=True,   
                            transform=transforms.ToTensor(),  
                            download=True) 

# 测试集
test_dataset = datasets.MNIST(root='./data', 
                           train=False, 
                           transform=transforms.ToTensor())

# 构建batch数据
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True)

  展示其中一张手写数字图片

a=np.array(train_dataset.data)
plt.imshow(a[2])

在这里插入图片描述

二、搭建网络

  数据处理完成之后就要搭建网络结构了,由于我们的输入是图片,选择进行三次二维卷积、激活、池化序列操作。
  自己的网络要继承nn.Module,并在构造方法中调用父类的构造方法。
  在第一次二维卷积中,由于我们的输入是灰度图,即在RGB中选一个通道,故in_channels=1,即输入通道数为1;由于要输出16个特征图(有几个特征图就有几个卷积核),故out_channels=16,即输出通道数为16;卷积核尺寸kernel_size设为33,是一个正方形;步长stride设为1;设填充了1圈0,即padding=1。输出的特征图维度为(16,28,28)。
  卷积后激活。
  激活后池化(卷积和激活必不可少,而池化可选写) 操作2
2区域,池化后变成(16,14,14)。
  在第一次二维卷积中,由于此层的输入是上一层的输出,故输入通道in_channels=16;
代码如下:

class my_conv(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1=torch.nn.Sequential(  
            nn.Conv2d
                in_channels=1,
                out_channels=16,
                kernel_size=3,
                stride=1,
                padding=1
            ),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2),)
        self.conv2=torch.nn.Sequential(
            nn.Conv2d(
                in_channels=16,
                out_channels=32,
                kernel_size=3,
                stride=1,
                padding=1
            ),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2),)
        self.conv3=torch.nn.Sequential(
            nn.Conv2d(
                in_channels=32,
                out_channels=64,
                kernel_size=3,
                stride=1,
                padding=1
            ),
            nn.ReLU())
        self.out=nn.Linear(64*7*7,10)
    def forward(self,x):
        x=self.conv1(x)
        x=self.conv2(x)
        x=self.conv3(x)
        x=x.view(x.shape[0],-1)
        x=self.out(x)
        return x
# 三、训练与评估
      和之前文章(https://blog.csdn.net/weixin_43535003/article/details/126085626)类似,此处不再赘述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

远山0128

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值