主要介绍一些pytorch框架常用的方法,这里torch环境实在torch0.3.1情况,请对号入座。。。
1、首先介绍我们学习pytorch的官方教程地址:http://pytorch.org/docs/master/index.html;还有一个中文文档:点击打开链接,0.4版本的官方文档:点击打开链接
2、我个人也是 pytorch 的初学者,我以一个初学者的身份来简单介绍torch的使用,pytorch是使用GPU和CPU优化的深度张量库,torch中最重要的一个数据类型就是Tensor(张量),我们计算的时候用Tensor来计算,速度要快一点,如果在训练神经网络进行梯度运算的时候,一般都会用Varaible类型来计算。
常用的Tensor方法:
input:输入可以是Tensor向量,也可以输入单个值。output表示返回的结果,返回可以是向量也可以单个值。
- torch.lerp(star, end, weight) : 返回结果是out= start+ (end-start) * weight
- torch.rsqrt(input) : 返回平方根的倒数
- torch.mean(input) : 返回平均值
- torch.std(input) : 返回标准偏差
- torch.prod(input) : 返回所有元素的乘积
- torch.sum(input) : 返回所有元素的之和
- torch.var(input) : 返回所有元素的方差
- torch.tanh(input) :返回元素双正切的结果
- torch.equal(torch.Tensor(a), torch.Tensor(b)) :两个张量进行比较,如果相等返回true,否则返回false
- torch.ge(input,other,out=none) 、 torch.ge(torch.Tensor(a),torch.Tensor(b)) 比较内容:
- ge: input>=other 也就是a>=b, 返回true,否则返回false
- gt: input> other 也就是a>b, 返回true,否则返回false
- lt: input<other 也就是a<b, 返回true,否则返回false
- torch.max(input): 返回输入元素的最大值
- torch.min(input) : 返回输入元素的最小值
- element_size() :返回单个元素的字节
>>>torch.FloatTensor.element_size()
>>>4
>>>torch.ByteTensor.element_size()
>>>1
pytorch 在神经网络常用的方法
1、expand(*size)
返回tensor的一个新视图,单个维度扩大为更大的尺寸。tensor也可以扩大为更高维,新增加的维度将附在前面。 扩大tensor不需要分配新内存,只是仅仅新建一个tensor的视图,其中通过将stride
设为0,一维将会扩展位更高维。任何一个一维的在不分配新内存情况下可扩展为任意的数值。
2、index_add_(dim, index, tensor) → Tensor
按参数index中的索引数确定的顺序,将参数tensor中的元素加到原来的tensor中。参数tensor的尺寸必须严格地与原tensor匹配,否则会发生错误。参数: - dim(int)-索引index所指向的维度 - index(LongTensor)-需要从tensor中选取的指数 - tensor(Tensor)-含有相加元素的tensor
>>> x = torch.Tensor([[1, 1, 1], [1, 1, 1], [1, 1, 1]])
>>> t = torch.Tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
>>> index = torch.LongTensor([0, 2, 1]) #这里是把第2行和第3行进行对调
>>> x.index_add_(0, index, t)
>>> x
2 3 4
8 9 10
[torch.FloatTensor of size 3x3]
3、index_copy_(dim, index, tensor) → Tensor
按参数index中的索引数确定的顺序,将参数tensor中的元素复制到原来的tensor中。参数tensor的尺寸必须严格地与原tensor匹配,否则会发生错误。解释一下:index = torch.LongTensor([0,2,1]),这里是把第2行和第3行进行对调,所以得到上述结果。
4、norrow (demension , start, length)---> te
返回一个本tensor经过缩小后的tensor。维度dim
缩小范围是start
到start+length
。原tensor与返回的tensor共享相同的底层内存。
>>>x = torch.Tensor([[1,2,3], [4,5,6], [7,8,9]])
>>>x.narrow(0,0,2)
1 2 3
4 5 6
[torch.FloatTensor of size 2x3]
>>>x.narrow(1,1,2)
2 3 5
6 8 9
[torch.FloatTensor of size 3x2]
4、permute(dims),常用的维度转换方法
将tensor的维度换位 参数:dim(int)---换位顺序
>>>x = torch.randn(2,3,4)
>>>x.size()
torch.size([2,3,5])
>>>x.permute(2,0,1).size()
torch.size([5,2,3])
5、 repeat(*sizes)
沿着指定的维度重复tensor。不同与expand(),本函数复制的是tensor中的数据。
参数:*size(torch.size ot int...)-沿着每一维重复的次数
>>>x = torch.Tensor([1,2,3])
>>>x.repeat(4,2)
1 2 3 1 2 3
1 2 3 1 2 3
1 2 3 1 2 3
1 2 3 1 2 3
[torch.FloatTensor of size 4x6]
6、resize_(*size)
>>>x.repeat(4,2)
1 2 3 1 2 3
1 2 3 1 2 3
1 2 3 1 2 3
1 2 3 1 2 3
[torch.FloatTensor of size 4x6]
>>>x.repeat(4,2,1).size()
torch.Size([4,2,3])
7、resize_(*size)
将tensor的大小调整为指定的大小。如果元素个数比当前的内存大小大,就将底层存储大小调整为与新元素数目一致的大小。
如果元素个数比当前内存小,则底层存储不会被改变。原来tensor中被保存下来的元素将保持不变,但新内存将不会被初始化。
参数:sizes(torch.Size or int....)需要调整的大小
>>>x = torch.Tensor([[1,2], [3,4], [5,6]])
>>>x.resize_(2,2) #这两个2,分别表示两行两列,如果换成(1,3),则打印的结果是一个一行三列的向量
>>>x
12
34
[torch.FloatTensor of size 2x2]
8、storage_offset()---->int
以存储元素的个数的形式返回tensor在地城内存中的偏移量。
>>>x = torch.Tensor([1,2,3,4,5])
>>>x.storage_offset()
0
>>>x[3:].storage_offset()
3
9、unfold(dim, size, step)---->Tensor
返回一个Tensor,其中含有在dim维tianchong度上所有大小为size的分片。两个分片之间的步长为step。如果_sizedim_是dim维度的原始大小,则返回tensor
中的维度dim大小是_(sizesdim-size)/step+1_维度大小的附加维度将附加在返回的tensor中。
参数:_dim(int)--需要展开的维度--size(int)每一个分片需要展开的大小--step(int)-相邻分片之间的步长
10、torch.gather(input, dim, index)
说明一下: dim=1,表示按行索引,dim = 0,按列索引。举例说明一下
import torch
input = torch.LongTensor([[1,2],[3,4]])
print(input)
index = torch.LongTensor([[0,0],[1,0]])
res = torch.gather(input, 1, index)
print(res)
结果是:
1 2
3 4
[torch.LongTensor of size 2x2]
1 1
4 3
[torch.LongTensor of size 2x2]
按列索引:
import torch
input = torch.LongTensor([[1,2],[3,4]])
index = torch.LongTensor([[0,0],[1,0]])
res = torch.gather(input, 0, index)
print(res)
结果是:
1 2
3 4
[torch.LongTensor of size 2x2]
1 2
3 2
[torch.LongTensor of size 2x2]
另一个例子
index0 = torch.LongTensor([[0], [1]])
print(index0)
res = torch.gather(input, 1, index0)
print(res)
结果是:
0
1
[torch.LongTensor of size 2x1]
1
4
[torch.LongTensor of size 2x1]
11、torch.masked_select(input, mask)
说明一下这个方法的使用,input、mask这两个参数维度必须一致,我试过不同维度,但是都没有成功,姑且这么认为吧。mask必须是ByteTensor类型。
masked =torch.ByteTensor([[0,1,0,0],[0,0,0,1],[0,0,1,0]])
input = torch.LongTensor([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
res = torch.masked_select(input,masked)
print(res)
结果是:
2
8
11
[torch.LongTensor of size 3]
12、target.masked_scatter_(mask, source)
说明:source是表示用来替换(改变)的值,而mask只有0,1;0表示不替换目标值(或者叫不改变);1是表示要替换目标值。target是需要被替换(改变)的值 。特别说明一下,mask、source的维度一致,而且必须和target的行的维度一致。
source = torch.LongTensor([[5],[7]])
mask = torch.ByteTensor([[1],[0]])
target = torch.LongTensor([[1,2],[3,4]])
res = target.masked_scatter_(mask,source)
print(res)
结果是:
5 7
3 4
[torch.LongTensor of size 2x2]
source = torch.LongTensor([[5],[7]])
mask = torch.ByteTensor([[0],[0]]) ###改变索引值
target = torch.LongTensor([[1,2],[3,4]])
res = target.masked_scatter_(mask,source)
print(res)
1 2
3 4
[torch.LongTensor of size 2x2]
source = torch.LongTensor([[5],[7]])
mask = torch.ByteTensor([[0],[1]]) #####改变索引值
target = torch.LongTensor([[1,2],[3,4]])
res = target.masked_scatter_(mask,source)
print(res)
1 2
5 7
[torch.LongTensor of size 2x2]
上述的每个方法都参考过文章前面的两个链接,如果你想深入了解,转向链接。