PyTorch学习中的常用函数及问题解析

最新推荐文章于 2024-04-17 16:49:09 发布

yangjingcong

最新推荐文章于 2024-04-17 16:49:09 发布

阅读量267

点赞数

分类专栏：深度学习入门教程文章标签： pytorch 深度学习神经网络 python 人工智能

本文链接：https://blog.csdn.net/yangjingcong/article/details/108900877

版权

6 篇文章 0 订阅

订阅专栏

一.torchvision

torchvision是pytorch的一个图形库，主要用来构建计算机视觉模型。

(1).torchvision.transforms.Compose() : 用来组合多个torchvision.transforms操作

参数： 一个list数组，数组里是多个’Transform’对象，即[transforms, transforms…]。
操作： 如下所示，遍历list数组，对img依次执行每个transforms操作，并返回transforms后的img。

 def __call__(self, img):
        for t in self.transforms:
            img = t(img)
        return img

示例：

transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

（2）transforms.ToTensor()
将numpy的ndarray或PIL.Image读的图片转换成形状为(C,H, W)的Tensor格式，且/255归一化到[0,1.0]之间

（3）transforms.Normalize()
ToTensor()能够把灰度范围从0-255变换到0-1之间，而transform.Normalize()则把0-1变换到(-1,1).具体地说，对每个通道而言，Normalize执行以下操作：

image=(image-mean)/std

其中mean和std分别通过(0.5,0.5,0.5)和(0.5,0.5,0.5)进行指定。原来的0-1最小值0则变成(0-0.5)/0.5=-1，而最大值1则变成(1-0.5)/0.5=1.

一些加载数据的函数及常用的数据集接口；如

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)

包含常用的模型结构（含预训练模型），如AlexNet、VGG、ResNet等；

其他的一些有用的方法。
（1）torch.utils.data.DataLoader

trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2)

num_workers：（数据类型 Int）
工作者数量，默认是0。使用多少个子进程来导入数据。设置为0，就是使用主进程来导入数据。注意：这个数字必须是大于等于0的，负数估计会出错。

（2）torchvision.utils.make_grid()
将若干幅图像拼成一幅图像

在torch里面，view函数相当于numpy的reshape
-1表示一个不确定的数，就是你如果不确定你想要reshape成几行，但是你很肯定要reshape成4列，那不确定的地方就可以写成-1

例如一个长度的16向量x，

x.view(-1, 4)等价于x.view(4, 4)

x.view(-1, 2)等价于x.view(8，2)

关注