pytorch-个别函数用法记录

最新推荐文章于 2023-10-02 14:32:27 发布

要坚持写博客呀

最新推荐文章于 2023-10-02 14:32:27 发布

阅读量276

点赞数

分类专栏： 4. Pytorch 文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/weixin_39263657/article/details/120298865

版权

4. Pytorch 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.torch.tensor和torch.Tensor的区别

背景

torch.tensor和torch.Tensor都可以生成或将其他变量转换为tensor张量。
torch.tensor为一个函数，返回的是torch.Tensor类实例化的对象，data类型对应单双精度的torch.Tensor。
torch.Tensor为一个类，将data转换为单精度浮点型的torch.FloatTensor（torch.Tensor），类中的init函数默认转换。

torch.tensor

torch.tensor(data, *, dtype=None, device=None, requires_grad=False, pin_memory=False)
为data构建以一个tensor
data：可以是list，tuple，numpy ndarray，scaler和其他类型。
dtype：可选参数，torch.dtype，例如torch.float32，torch.float64， torch.double等
device：可选参数，将tensor放在cpu上或者gpu上，例如device=torch.device(‘cuda:0’)
requires_grad：可选参数，默认为False。当前量是否需要在计算中保留对应的梯度信息。
pin_memory：可选参数，默认为False。为True时候为锁页内存，转义到GPU上快（显卡上的内存全部为锁页内存），不与硬盘上的内存进行交换。不锁页内存：主机内存不够时候会存放到硬盘内存（虚拟内存）上。如果资源充足设为True，否则设为False。

注意的点：
torch.tensor为拷贝data，即不共用存储空间，data改变，torch.tensor(data)，不改变。
如果想要避免拷贝，即引用、共用存储空间，data改变，torch.tensor(data) 也改变。则需要用：
torch.Tensor.requires_grad_() 或者 torch.Tensor.detach()
torch.Tensor.detach()：共用存储空间，但是从原始的计算图中分离。比如model_A输出了一个tensor_a, tensor_a作为输入要输入到model_B中，此时想通过损失函数反向传播修改B网络的参数，但是不想修改A网络的参数就可以用detach方法，即将a从网络A中的计算图分离出来。
如果是numpy ndarray避免拷贝，则使用torch.as_tensor().

根据原始数据类型生成相应的torch.LongTensor， torch.FloatTensor，torch.DoubleTensor. torch.tensor(data)，data数字后面需要加 . 才能转为torch.FloatTensor.

>>> a = torch.tensor([1, 2])
>>> a.type()
'torch.LongTensor'

>>> a = torch.tensor([1., 2.])
>>> a.type()
'torch.FloatTensor'

torch.Tensor

是一个类，init函数将data初始化为torch.FloatTensor，类中有许多对应的操作，如Tensor.max(), Tensor.new_tensor, Tensor.new_empty等。

使用

创建一个已经存的数据使用torch.tensor().
创建一个指定size的tensor，使用torch.*, 如torch.zeros(size=(2,3)), torch.ones(size=(2,3))
创建一个和其他tensor 形状一样的tensor，使用torch.*_like，如torch.zeros_like(size=(2,3)), torch.ones_like(size=(2,3))

2.tensor.reshape()、tensor.view()、tensor.resize_()

reshape和resize区别：

张量（tensor）是否连续： tensor中元素的地址是否连续。

导致张量不连续的操作： tensor.transpose(), tensor.permute()等操作会使得张量在内存中变得不连续。

reshape和view的相同点： 都是改变tensor的形状，且返回的张量与张量不共享内存即更改原始张量对返回的张量无影响，更改返回的张量对原始的张量也无影响。

reshape和view的不同点：
①当张量连续时，二者基本一样。tensor.view()返回的张量与原张量共享基础数据(存储器，即基础数据都是完全一样的，只是不同形状的数据。不是共享内存地址！！)，而tensor.reshape()可能返回的是原张量的copy也可能是和.view()方法返回一样类型。能返回.view()就返回，否则就是copy。
②当张量不连续时，tensor.view()不能使用，需要先转换为连续tensor，即应该使用tensor.contiguous().view()。而tensor.reshape()则会先clone一个，即与原张量完全无关。