PyTorch学习中的常用函数及问题解析

一.torchvision

torchvision是pytorch的一个图形库,主要用来构建计算机视觉模型。

1.torchvision.transforms: 常用的图片变换,例如裁剪、旋转等;

(1).torchvision.transforms.Compose() : 用来组合多个torchvision.transforms操作

参数: 一个list数组,数组里是多个’Transform’对象,即[transforms, transforms…]。
操作: 如下所示,遍历list数组,对img依次执行每个transforms操作,并返回transforms后的img。

 def __call__(self, img):
        for t in self.transforms:
            img = t(img)
        return img

示例:

transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

(2)transforms.ToTensor()
将numpy的ndarray或PIL.Image读的图片转换成形状为(C,H, W)的Tensor格式,且/255归一化到[0,1.0]之间

(3)transforms.Normalize()
ToTensor()能够把灰度范围从0-255变换到0-1之间,而transform.Normalize()则把0-1变换到(-1,1).具体地说,对每个通道而言,Normalize执行以下操作:

image=(image-mean)/std

其中mean和std分别通过(0.5,0.5,0.5)和(0.5,0.5,0.5)进行指定。原来的0-1最小值0则变成(0-0.5)/0.5=-1,而最大值1则变成(1-0.5)/0.5=1.

2.torchvision.datasets:

一些加载数据的函数及常用的数据集接口; 如

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)

3.torchvision.models:

包含常用的模型结构(含预训练模型),如AlexNet、VGG、ResNet等;

4.torchvision.utils:

其他的一些有用的方法。
(1)torch.utils.data.DataLoader

trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2)

num_workers:(数据类型 Int)
工作者数量,默认是0。使用多少个子进程来导入数据。设置为0,就是使用主进程来导入数据。注意:这个数字必须是大于等于0的,负数估计会出错。

(2)torchvision.utils.make_grid()
将若干幅图像拼成一幅图像

二.x = x.view(-1, …)

在torch里面,view函数相当于numpy的reshape
-1表示一个不确定的数,就是你如果不确定你想要reshape成几行,但是你很肯定要reshape成4列,那不确定的地方就可以写成-1

例如一个长度的16向量x,

x.view(-1, 4)等价于x.view(4, 4)

x.view(-1, 2)等价于x.view(8,2)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值