《深度学习之Pytorch》学习笔记

最新推荐文章于 2024-04-28 19:39:34 发布

亚里

最新推荐文章于 2024-04-28 19:39:34 发布

阅读量234

点赞数

分类专栏：平台工具类

本文链接：https://blog.csdn.net/PAN_Andy/article/details/100899991

版权

平台工具类专栏收录该内容

14 篇文章 3 订阅

订阅专栏

第3章多层全连接神经网络

3.1 热身：PyTorch基础

3.1.1 Tensor(张量)

Tensor，张量，是一个多维矩阵，零维矩阵是一个点，一维是向量，二维是一般的矩阵，多维就相当于一个多维数组。PyTorch的Tensor可以和numpy的ndarray相互转换，PyTorch可以在GPU上运行。

不同数据类型的Tensor，torch.FloatTensor, torch.DoubleTensor, torch.ShortTensor, torch.IntTensor, torch.LongTensor。torch.Tensor默认的是torch.FloatTensor数据类型，也可以定义所需要的类型。

b.numpy()能将tensor转换为numpy数据类型，torch.from_numpy()能将numpy转换为tensor。

torch.cuda.is_available()用于判断是否支持GPU，a.cuda()能够将tensor a放到GPUh 。

3.1.2 Variable

variable提供自动求导功能，variable会被放入一个计算图中，然后进行前身传播，反向传播，自动求导。

variable是在torch.autograd.Variable中，Variable(a)可以将一个tensor a变成Variable。variable比较重要的属性有data,grad和grad_fn。通过data可以取出variable里的tensor的数值，grad_fn表示得到这个Variable的操作，grad是这个Variable是反传播梯度。构建variable时，传入参数requires_grad=True，表示对这个变量求梯度，默认是False。y.backward()就是自动求导，自动求导不需要你再去明确地写明哪个函数对哪个函数求导，直接通过这行代码就对所有的需要梯度的变量进行求导，得到它们的梯度，然后通过x.grad可以得到x的梯度。

3.1.3Dataset

PyTorch提供了很多工具使得数据的读取和预处理变得很容易。

torch.utils.data.Dataset是代表这一数据的抽象类，可以定制自己的数据类继承和重写这个抽象类，只需要定义__len__和__getitem__这两个函数。

重写Dataset方法这种方式，可以通过迭代的方式取得每一个数据，但是这样很难取batch，shuffle或者多线程去读取数据，PyTorch中定义了其他方法，torch.utils.data.DataLoader来定义一个新的迭代器。

另外，torchvision包中还有一个关于计算机视觉的数据读取类：ImageFolder，主要功能是处理图片，要求图像按root/dog/xxx.png的形式存放。

dataset = ImageFolder(root='root_path', transform=None, loader=default_loader)

其中的root需要是根目录，在这个目录下有几个文件夹，每个文件夹表示一个类别：transform和target_transform是图片增强；loader是图片的读取办法，然后通过loader将图片转换成我们需要的图片类型进入神经网络。

3.1.4nn.Module(模组)

在PyTorch里编写神经网络，所有的层结构和损失函数都来自于torch.nn,所有的模型构建都是从这个基类nn.modeule继承的。定义完模型之后，需要通过nn这个包来定义损失函数，常见的损失函数已经定义在nn中了，比如均方误差、多分类的交叉熵，以及二分类的交叉熵等等。criterion = nn.CrossEntropyLoss() loss = criterion(output,target)，这样就可以算出Loss了，也可以根据自己需求定制loss。