dataloader的简单介绍
- dataset (Dataset) :需要导入dataset类型,从dataset中提取需要训练的数据
- batch_size (int, optional):每一批次训练的数据的数量
- shuffle (bool, optional) :如果是True的话,每一轮训练dataset数据集(训练完所有的数据后算一轮),其中数据的顺序会被打乱
- num_workers (int, optional) :用于数据加载的子进程数。“0”表示数据将加载到主进程中。(默认值:“0”)
- drop_last (bool, optional):如果是True的话,当最后一个批次的数据集的数量小于batch_size时,则舍弃这些数据;如果是False的话,不管最后一个批次的数据集有多小,都会利用
import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torchvision.transforms import transforms
dataset_transform = transforms.Compose([
transforms.ToTensor()
])
test_set = torchvision.datasets.CIFAR10(root="./", train=False, transform=dataset_transform, download=True)
#将dataset导入DataLoader,设置每个批次的训练量为64,不打乱数据,将小于64的数据集给舍弃
test_loader=DataLoader(dataset=test_set,batch_size=64,shuffle=False,num_workers=0,drop_last=True)
writer=SummaryWriter("dataloader")
#两轮训练
for epoch in range(2):
step=0
for data in test_loader:
imgs,targets=data#和torchvision一样读取数据
print(imgs.shape)#打印结构,可以看到是CWH格式
print(targets)#打印64个数据集的类别
print("......")
writer.add_images("Epoch:{}".format(epoch),imgs,step)
step = step +1
writer.close()
torch.Size([64, 3, 32, 32])
tensor([7, 0, 5, 0, 1, 9, 7, 3, 5, 2, 3, 9, 5, 6, 4, 0, 0, 0, 8, 0, 3, 2, 4, 5,
3, 7, 9, 6, 9, 3, 1, 2, 6, 7, 4, 5, 1, 3, 7, 6, 9, 5, 8, 5, 8, 5, 8, 5,
6, 5, 0, 8, 3, 8, 1, 8, 1, 5, 0, 9, 8, 6, 3, 6])
......
torch.Size([64, 3, 32, 32])
tensor([3, 4, 4, 7, 4, 7, 4, 3, 2, 4, 5, 5, 7, 5, 4, 5, 8, 0, 5, 4, 0, 5, 4, 3,
3, 2, 4, 2, 9, 4, 8, 8, 6, 2, 6, 1, 7, 0, 4, 3, 8, 5, 9, 7, 6, 7, 1, 0,
2, 3, 5, 6, 7, 1, 6, 2, 8, 3, 7, 2, 5, 7, 5, 7])
......
torch.nn.Module神经网络的基本骨架
import torch.nn as nn
import torch.nn.functional as F
class Model(nn.Module):
def __init__(self):
super().__init__()
self.conv1 = nn.Conv2d(1, 20, 5)
self.conv2 = nn.Conv2d(20, 20, 5)
def forward(self, x):
x = F.relu(self.conv1(x))
return F.relu(self.conv2(x))
As per the example above, an
__init__()
call to the parent class must be made before assignment on the child.即所有的子类都要进行初始化
在初始化时创建一个Module
的子类Model
,创建属性conv1和conv2,x = F.relu(self.conv1(x))
为先进行Conv2d(1, 20, 5)
,后进行relu()
激活,在return
时,再次进行nn.Conv2d(20, 20, 5)
再次进行卷积后,进行relu()
激活
按照小土堆的教程写一个框架
import torch
from torch import nn
class Tudui(nn.Module):
def __init__(selfs):
super().__init__()
def forward(self,input):
output=input+1
return output
tudui=Tudui()
x=torch.tensor(1.0)
output=tudui(x)
print(output)
tensor(2.)
通过套用模板,利于tudui=Tudui()
创建一个实例,将x带入后可以得到一个return
,输出后可得output
卷积层参数介绍以CONV2D为例
Prameters
- in_channels (int) – 输入的通道数
- out_channels (int) – 输出的通道数
- kernel_size (int or tuple) – 卷积核的尺寸
- stride (int or tuple, optional) – 卷积核每次移动的距离
- padding (int, tuple or str, optional) – 选择是否要向数据的四周填充一圈数据,默认数字是0
- padding_mode (string*,* optional) – 可以选择填充模式:
'zeros'
,'reflect'
,'replicate'
or'circular'
. 默认是0 - dilation (int or tuple, optional) – 默认是1,
import torch
import torchvision
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torchvision.transforms import transforms
dataset_transform = transforms.Compose([
transforms.ToTensor()
])
test_set = torchvision.datasets.CIFAR10(root="./", train=False, transform=dataset_transform, download=True)
test_loader=DataLoader(dataset=test_set,batch_size=64,shuffle=False,num_workers=0,drop_last=True)
class Tudui(nn.Module):
def __init__(self):
super(Tudui,self).__init__()
self.conv1=Conv2d(in_channels=3,out_channels=6,kernel_size=3,stride=1,padding=0)
def forward(self,x):
x=self.conv1(x)
return x
tudui=Tudui()
for data in test_loader:
imgs,target=data
output=tudui(imgs)
print(imgs.shape)
print(output.shape)
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
可以看到通道数变为6
卷积操作
卷积操作可以看这个链接https://www.bilibili.com/video/BV1hE411t7RN?p=17&vd_source=13fde6102e03d72e26929b3886a9947e
其目的是通过卷积操作对输入图像进行降维和特征抽取,在不填充最外围的情况下,使用(3,3)卷积核会使上下左右四个方向的一行像素“丢失”,因此在经过layers.Conv2D
后,Output Shape= (None, 30, 30, 32)
,x与y轴各少两行
如下图所示,漂浮在上方的为卷积核,对应数字一次相乘后再相加,并赋值到卷积核中心点的位置(通常情况是这样),之后进行平移(根据Stride决定一次平移几格),再一次重复运算。我们就可以发现最上方和最左方就没有值了
imgs.shape)
print(output.shape)
```python
torch.Size([64, 3, 32, 32])
torch.Size([64, 6, 30, 30])
可以看到通道数变为6
卷积操作
卷积操作可以看这个链接https://www.bilibili.com/video/BV1hE411t7RN?p=17&vd_source=13fde6102e03d72e26929b3886a9947e
其目的是通过卷积操作对输入图像进行降维和特征抽取,在不填充最外围的情况下,使用(3,3)卷积核会使上下左右四个方向的一行像素“丢失”,因此在经过layers.Conv2D
后,Output Shape= (None, 30, 30, 32)
,x与y轴各少两行
如下图所示,漂浮在上方的为卷积核,对应数字一次相乘后再相加,并赋值到卷积核中心点的位置(通常情况是这样),之后进行平移(根据Stride决定一次平移几格),再一次重复运算。我们就可以发现最上方和最左方就没有值了
[外链图片转存中…(img-EmBnoE4f-1662377841564)]
[外链图片转存中…(img-QNEWXA4e-1662377841564)]