前要
这两个函数都是用来改变tensor
的形状的,区别看第[2.区别]
三个前提知识点:
x= x+1
在pytorch
和python
中会新开辟空间存储计算结果, 重开x的内存地址,让x指向新的结果;自加(减)运算符x += 1
和使用不会,是修改原始数据。- 面向对象语言:对象和数据的地址分开,比如
x = [1,2,3]
,对象是x
,数据是[1,2,3]
。 id()
函数只能看对象内存地址。
1. 文档解释
view()
# 使用方法
x_tensor.view(*args) → Tensor
- 返回一个有相同数据但结构不同的tensor。
- 返回的tensor必须有与原tensor相同的数据和相同数目的元素,但可以有不同的大小。
- 一个tensor必须是连续的contiguous()才能被view()。
参数:
- x_tensor: 想改变结构的tensor
- args: 目标结构
例:
x = torch.randn(4, 4)
x.view(2,8)
reshape()
reshape
和上面的是一样的使用方法,但是是对于不连续的数据可以改变形状。
2. 区别
view()
和reshape()
有两点以下区别。
view()
是内存共享的,reshape()
不是共享的,可以理解为reshape获取的是tensor克隆真实副本,而不是view()改变了tensor的观察视角而已,然而实际上并不会这样使用它,因为reshape
通常获取不到原数据的拷贝(因为会改变data
的内存地址),所以一般用clone()
克隆tensor后再view
,确保对象和数据两个内存地址都被完整复制走。
x = torch.randint(0,20,(2,3))
'''
tensor([[ 7., 2., 16.],
[17., 19., 15.]])
'''
y = x.view(6)
'''
tensor([ 7., 2., 16., 17., 19., 15.])
'''
z = x.view(-1,2)
'''
tensor([[ 7., 2.],
[16., 17.],
[19., 15.]])
'''
##########区别##############
# 地址是否一样:
print(id(x)==id(y), id(x)==id(z), id(y)==id(z))
print(id(x.data)==id(y.data),
id(x.data)==id(z.data),
id(y.data)==id(z.data))
''''outputs:
False False False
True True True
'''
# 改变x
x[0] = 1
'''outputs: 统一变化
tensor([[ 1., 1., 1.],
[17., 19., 15.]])
tensor([ 1., 1., 1., 17., 19., 15.])
tensor([[ 1., 1.],
[ 1., 17.],
[19., 15.]])
'''
# 改变z
z[0] = 0
''''outputs: 统一变化
tensor([[ 0., 0., 1.],
[17., 19., 15.]])
tensor([ 0., 0., 1., 17., 19., 15.])
tensor([[ 0., 0.],
[ 1., 17.],
[19., 15.]])
'''
既然已经讲到这里,不妨提一下数据操作:x= x+1
在pytorch
和python
中会新开辟空间存储计算结果, 重开x的内存地址,让x指向新的结果;自加(减)运算符x += 1
和使用不会,是修改原始数据。
例子如下
x = x + 1
'''ouputs
tensor([[ 1., 1., 2.],
[18., 20., 16.]])
tensor([ 0., 0., 1., 17., 19., 15.])
tensor([[ 0., 0.],
[ 1., 17.],
[19., 15.]])
'''
- 对于不连续的tensor,也就是
tensor . is_contiguous()==False
使用view()会报错如下:
RuntimeError: invalid argument 2: view size is not compatible with input tensor's....
因为tensor经过转置后数据的内存地址不连续导致的,转置函数可以看pytorch两个转置函数
但是reshape()
可以改变这种内存不连续tensor
的结构,而view()
不可以,因为reshape
等价于先contiguous()
再view()
,也就是数据内存给你撸顺了,再改变观察视角。
例子如下:
x = torch.rand(3,4)
x = x.transpose(0,1)
print(x.is_contiguous())
'False'
# 会发现
x.view(3,4)
'''
RuntimeError: invalid argument 2: view size is not compatible with input tensor's....
内存地址不连续导致该错误
'''
# 但是这样是可以的。
x = x.contiguous()
x.view(3,4)
我们再看看reshape()
x = torch.rand(3,4)
x = x.permute(1,0) # 等价x = x.transpose(0,1)
x.reshape(3,4)
'''这就不报错了
说明x.reshape(3,4) 这个操作
等于x = x.contiguous().view()
尽管如此,但是torch文档中还是不推荐使用reshape
理由是除非为了获取完全不同但是数据相同的克隆体。
'''
3.关于连续contiguous()
目前pytorch
只要是transpose()
和permute()
这两个函数用过后,tensor
都会变得不再连续,就不可以使用view()
.
调用contiguous()
时,会强制拷贝一份tensor
,让它的布局和从头创建的一毛一样。
(这一段看文字你肯定不理解,你也可以不用理解,有空我会画图补上)
你只需要记住了,使用view()
之前,只要使用了transpose()
和permute()
这两个函数一定要contiguous()