dataloader的简单介绍、torch.nn.Module神经网络的基本骨架、卷积层参数介绍以CONV2D为例、卷积原理概述

dataloader的简单介绍

  • dataset (Dataset) :需要导入dataset类型,从dataset中提取需要训练的数据
  • batch_size (int, optional):每一批次训练的数据的数量
  • shuffle (bool, optional) :如果是True的话,每一轮训练dataset数据集(训练完所有的数据后算一轮),其中数据的顺序会被打乱
  • num_workers (int, optional) :用于数据加载的子进程数。“0”表示数据将加载到主进程中。(默认值:“0”)
  • drop_last (bool, optional):如果是True的话,当最后一个批次的数据集的数量小于batch_size时,则舍弃这些数据;如果是False的话,不管最后一个批次的数据集有多小,都会利用
import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torchvision.transforms import transforms

dataset_transform = transforms.Compose([
    transforms.ToTensor()
])
test_set = torchvision.datasets.CIFAR10(root="./", train=False, transform=dataset_transform, download=True)
#将dataset导入DataLoader,设置每个批次的训练量为64,不打乱数据,将小于64的数据集给舍弃
test_loader=DataLoader(dataset=test_set,batch_size=64,shuffle=False,num_workers=0,drop_last=True)

writer=SummaryWriter("dataloader")
#两轮训练
for epoch in range(2):
    step=0
    for data in test_loader:
        imgs,targets=data#和torchvision一样读取数据
        print(imgs.shape)#打印结构,可以看到是CWH格式
        print(targets)#打印64个数据集的类别
        print("......")
        writer.add_images("Epoch:{}".format(epoch),imgs,step)
        step = step +1

writer.close()
torch.Size([64, 3, 32, 32])
tensor([7, 0, 5, 0, 1, 9, 7, 3, 5, 2, 3, 9, 5, 6, 4, 0, 0, 0, 8, 0, 3, 2, 4, 5,
        3, 7, 9, 6, 9, 3, 1, 2, 6, 7, 4, 5, 1, 3, 7, 6, 9, 5, 8, 5, 8, 5, 8, 5,
        6, 5, 0, 8, 3, 8, 1, 8, 1, 5, 0, 9, 8, 6, 3, 6])
......
torch.Size([64, 3, 32, 32])
tensor([3, 4, 4, 7, 4, 7, 4, 3, 2, 4, 5, 5, 7, 5, 4, 5, 8, 0, 5, 4, 0, 5, 4, 3,
        3, 2, 4, 2, 9, 4, 8, 8, 6, 2, 6, 1, 7, 0, 4, 3, 8, 5, 9, 7, 6, 7, 1, 0,
        2, 3, 5, 6, 7, 1, 6, 2, 8, 3, 7, 2, 5, 7, 5, 7])
......

torch.nn.Module神经网络的基本骨架

import torch.nn as nn
import torch.nn.functional as F

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 20, 5)
        self.conv2 = nn.Conv2d(20, 20, 5)

    def forward(self, x):
        x = F.relu(self.conv1(x))
        return F.relu(self.conv2(x))

As per the example above, an __init__() call to the parent class must be made before assignment on the child.

即所有的子类都要进行初始化

在初始化时创建一个Module的子类Model,创建属性conv1和conv2,x = F.relu(self.conv1(x))为先进行Conv2d(1, 20, 5),后进行relu()激活,在return时,再次进行nn.Conv2d(20, 20, 5)再次进行卷积后,进行relu()激活

按照小土堆的教程写一个框架

import torch
from torch import nn

class Tudui(nn.Module):
    def __init__(selfs):
        super().__init__()

    def forward(self,input):
        output=input+1
        return output
        
tudui=Tudui()
x=torch.tensor(1.0)
output=tudui(x)
print(output)
tensor(2.)

通过套用模板,利于tudui=Tudui()创建一个实例,将x带入后可以得到一个return,输出后可得output

卷积层参数介绍以CONV2D为例

Prameters

  • in_channels (int) – 输入的通道数
  • out_channels (int) – 输出的通道数
  • kernel_size (int or tuple) – 卷积核的尺寸
  • stride (int or tuple, optional) – 卷积核每次移动的距离
  • padding (int, tuple or str, optional) – 选择是否要向数据的四周填充一圈数据,默认数字是0
  • padding_mode (string*,* optional) – 可以选择填充模式:'zeros', 'reflect', 'replicate' or 'circular'. 默认是0
  • dilation (int or tuple, optional) – 默认是1,
import torch
import torchvision
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torchvision.transforms import transforms

dataset_transform = transforms.Compose([
    transforms.ToTensor()
])

test_set = torchvision.datasets.CIFAR10(root="./", train=False, transform=dataset_transform, download=True)
test_loader=DataLoader(dataset=test_set,batch_size=64,shuffle=False,num_workers=0,drop_last=True)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.conv1=Conv2d(in_channels=3,out_channels=6,kernel_size=3,stride=1,padding=0)

    def forward(self,x):
        x=self.conv1(x)
        return x

tudui=Tudui()

for data in test_loader:
    imgs,target=data
    output=tudui(imgs)
    print(imgs.shape)
    print(output.shape)
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])

可以看到通道数变为6

卷积操作

卷积操作可以看这个链接https://www.bilibili.com/video/BV1hE411t7RN?p=17&vd_source=13fde6102e03d72e26929b3886a9947e
其目的是通过卷积操作对输入图像进行降维和特征抽取,在不填充最外围的情况下,使用(3,3)卷积核会使上下左右四个方向的一行像素“丢失”,因此在经过layers.Conv2D后,Output Shape= (None, 30, 30, 32) ,x与y轴各少两行

如下图所示,漂浮在上方的为卷积核,对应数字一次相乘后再相加,并赋值到卷积核中心点的位置(通常情况是这样),之后进行平移(根据Stride决定一次平移几格),再一次重复运算。我们就可以发现最上方和最左方就没有值了
image-20220802152730779

image-20220905193538578

imgs.shape)
print(output.shape)


```python
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])

可以看到通道数变为6

卷积操作

卷积操作可以看这个链接https://www.bilibili.com/video/BV1hE411t7RN?p=17&vd_source=13fde6102e03d72e26929b3886a9947e
其目的是通过卷积操作对输入图像进行降维和特征抽取,在不填充最外围的情况下,使用(3,3)卷积核会使上下左右四个方向的一行像素“丢失”,因此在经过layers.Conv2D后,Output Shape= (None, 30, 30, 32) ,x与y轴各少两行

如下图所示,漂浮在上方的为卷积核,对应数字一次相乘后再相加,并赋值到卷积核中心点的位置(通常情况是这样),之后进行平移(根据Stride决定一次平移几格),再一次重复运算。我们就可以发现最上方和最左方就没有值了
[外链图片转存中…(img-EmBnoE4f-1662377841564)]

[外链图片转存中…(img-QNEWXA4e-1662377841564)]

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值