为什么需要Tensor.contiguous()? PyTorch中Tensor.contiguous()作用分析

最新推荐文章于 2025-02-12 12:31:27 发布

Codefmeister

最新推荐文章于 2025-02-12 12:31:27 发布

阅读量6.6k

点赞数 3

分类专栏： PyTorch 笔记文章标签： pytorch tensor

本文链接：https://blog.csdn.net/weixin_43977640/article/details/111152239

版权

笔记同时被 2 个专栏收录

48 篇文章

订阅专栏

PyTorch

15 篇文章

订阅专栏

本文解释了PyTorch中Tensor.contiguous()的功能及其必要性。该函数确保Tensor在内存中连续存储，这对于某些依赖内存连续性的操作至关重要。文章通过实例说明了在进行如转置等操作后，原始Tensor可能不再连续，此时使用contiguous()可以创建一个新的连续存储的副本。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为什么需要Tensor.contiguous()

Tensor.contiguous()作用

Returns a contiguous in memory tensor containing the same data as self tensor. If self tensor is already in the specified memory format, this function returns the self tensor.

作用在官方文档里，描述的看似清晰但又模棱两可。例如x是一个Tensor，x.contiguous()的作用就是返回一个在内存中连续的Tensor，其data与Tensorx一致。如果源x本来就在内存中连续的话，那就返回其本身。

为什么要有Tensor.contiguous()?

Reference: StackOverflow–Why do we need contiguous?

在PyTorch中，有些对Tensor的操作并不实际改变tensor的内容，而只是改变如何根据索引检索到tensor的byte location的方式。
这些操作有：

narrow(), view(), expand(), transpose()，permute()

例如：当我们调用transpose()时，PyTorch并不会生成一个具有新的layout（大概可以翻译为布局）的新tensor。该操作仅仅改变了tensor中的meta information（元信息），所以offset和stride可以正确作用于新的shape。但是转置后的tensor和源tensor在事实上是共享同一块内存空间的。

>>> x = torch.randn(3,2)
>>> print(x)
tensor([[ 0.9181,  1.4266],
        [-0.1432, -0.7514],
        [ 0.9809, -0.5079]])
        
>>> print(x[0,0])
tensor(0.9181)

>>> y = x.transpose(1,0)
>>> print(y)
tensor([[ 0.9181, -0.1432,  0.9809],
        [ 1.4266, -0.7514, -0.5079]])
        
>>> print(y[0,0])
tensor(0.9181)

这就是contiguous的来源。上述例子中x是连续的，但是y不是，因为y的内存布局与从头开始新建一个与yshape相同的tensor的内存布局不同。
需要注意的是，contiguous这个单词有点被误解了，它并不是指tensor的内容在内存块上不连续。字节仍然是分配在同一个内存块上的，问题在于其元素之间的顺序order。

而当我们调用contiguous()时，实际上它是会复制一个张量，同时元素之间在内存上的顺序与从零开始新建的相同shape的张量一致。