对于pytorch中tensor的理解
1. tensor的组成
一切都是源于torch.is_storage这个函数的挖掘,因为不懂storage是什么,所以去查了,结果大吃一惊。
tensor分为头信息区(Tensor)和存储区(Storage),信息区主要存放以下信息:形状(size)、步长(stride)、数据类型(type)等。而真正的数据则保存成连续数组,保存在存储区。具体结构见下图(引用自参考1):
2. 代码测试
In [15]: import torch
In [16]: a = torch.tensor([1, 2, 3, 4, 5, 6])
In [17]: a
Out[17]: tensor([1, 2, 3, 4, 5, 6])
In [18]: a.storage()
Out[18]:
1
2
3
4
5
6
[torch.LongStorage of size 6]
In [19]: b = a.view(2, 3)
In [20]: b
Out[20]:
tensor([[1, 2, 3],
[4, 5, 6]])
In [21]: b.storage()
Out[21]:
1
2
3
4
5
6
[torch.LongStorage of size 6]
In [22]: id(a.storage()) == id(b.storage())
Out[22]: True
In [23]: c = a[2:]
In [24]: c
Out[24]: tensor([3, 4, 5, 6])
In [25]: c.storage()
Out[25]:
1
2
3
4
5
6
[torch.LongStorage of size 6]
In [26]: id(a.storage()) == id(c.storage())
Out[26]: True
In [27]: a.storage_offset()
Out[27]: 0
In [28]: b.storage_offset()
Out[28]: 0
In [29]: c.storage_offset()
Out[29]: 2
In [38]: a.stride()
Out[38]: (1,)
In [39]: b.stride()
Out[39]: (3, 1)
In [40]: c.stride()
Out[40]: (1,)
从测试可以看出,使用view方法或者切片方式,Tensor的数据并没有进行复制,而是简单修改了头信息区,因此,如果一个变量进行了修改,则其他变量也会跟着修改。
参考: