Pytorch: view()和reshape()的区别？他们与continues()的关系是什么？

最新推荐文章于 2025-03-02 10:13:47 发布

JacksonKim

最新推荐文章于 2025-03-02 10:13:47 发布

阅读量8.6k

点赞数 53

文章标签： python 机器学习 pytorch

本文链接：https://blog.csdn.net/qq_40765537/article/details/112471341

版权

一、概要

1. 两者相同之处

view()和reshape()在pytorch中都可以用来重新调整tensor的形状。

2. 两者不同之处

1). view()产生的tensor总是和原来的tensor共享一份相同的数据，而reshape()在新形状满足一定条件时会共享相同一份数据，否则会复制一份新的数据。

2). 两者对于原始tensor的连续性要求不同。reshape()不管tensor是否是连续的，都能成功改变形状。而view()对于不连续的tensor()，需要新形状shape满足一定条件才能成功改变形状，否则会报错。 transpose, permute 等操作会改变 tensor的连续性，在新形状shape不满足一定的情况下会报错。(注：有的人说view()函数只用于连续的tensor，事实上这是不准确的，可看下面解释)

3. 使用指南

如果你想要新的tensor和旧的tensor始终共享一份数据，使用view()

若只是单纯的改变形状，不要求共享数据，reshape()不容易出错

大部分情况下，了解以上即足够了，如果想要知道：

view(shape)在新形状shape满足哪些情况下才能成功改变形状
view和reshape的工作机制

你可以接着看下面的介绍。

二、Tensor的连续性

tensor的连续性是指逻辑上相邻的元素在内存中是否是连续存储的，如是，则称其是连续的，反之则是不连续的。我们可以调用tensor.is_contiguous()判断该tensor是否是连续的。下面通过举例说明。

当我们构造一个tensor如下：

a = torch.arange(12).reshape(3,4)

在没有任何transpose的情况下

逻辑上，它看起来是这样的：

在这里插入图片描述
实际上，在电脑内存中，a的存储是下面这样的：

在这里插入图片描述
由于逻辑上相邻的元素, 在内存上也是相邻的，我们称这个tensor是连续的(contiguous tensor)，此时a.is_contiguous() 为True.

在调用b=a.T之后

逻辑上，他看起来是这样的：

在这里插入图片描述
但实际上，在电脑内存中，b的存储仍然是下面这样的：

在这里插入图片描述
为什么存储跟a是一样的呢？这是由转置函数本身的机制决定的，

也就是说转置之后的tensor b和原来的tensor a共享一份数据，只是访问的方式改变了。由于此时b逻辑上相邻的两个元素在内存中并不连续存储，于是我们称tensor b是不连续的，此时b.is_contiguous() 为False.

三、 view()和reshape()的工作机制

1. view()的工作机制

这里的view和数据库中的视图(view)概念上十分类似，其本质就是不会复制一份新的数据，而是与原来的tensor或原来的数据库表共享一份相同的数据。

所以b=a.view(shape)中，tensor b与tensor a共享一份数据，修改b中的数据，a的相应元素也会改变。

上面我们说到view()对于不连续的tensor，需要新形状shape满足一定条件才能成功改变形状。那这里的条件是什么呢？

首先我们需要知道view()改变形状改的是什么，我们知道它与原tensor共享一份数据，所以数据存放顺序并没改变，它改变的是tensor的步幅(stride)，步幅的改变使得新tensor有他自己的访问方式和访问顺序。

如下例所示，a = torch.tensor([1,2,3,4]), 当访问下一个数据的时候，指针每次移动1，我们将这个移动距离定义为stride，而在view之后，这个步幅会变为(2,1)，从而支持在原始内存数据上用新的访问方式b[i,j]而不是a[i]来访问数据。

>>>a = torch.tensor([1,2,3,4])
>>>a.stride()
(1,)
>>>b = a.view((2,2))
>>>b.stride()
(2,1)

这里核心就在于b = a.view(shape)中的新形状shape基于不变的内存数据仍能以固定的步幅访问下一个元素，这样才能成功改变形状，否则若没有固定的步幅，我们无法实现元素的顺序访问，这种情况下程序会报错。

举例：比如说在第二部分中经过转置得到的tensor b，
在这里插入图片描述

我们知道它是不连续的，当我们执行b.view((12，))时就会出错

RuntimeError: view size is not compatible with input tensor's size and stride (at least one dimension spans across two contiguous subspaces). Use .reshape(...) instead.

这是因为假设我们希望通过b.view((12，))得到逻辑上连续的1维tensor([0, 4, 8, 1, 5, 9, 2, 6, 10, 3, 7, 11])
在这里插入图片描述
而其内存上的排列顺序仍为：

此时假设我们逻辑上顺序访问数组，那么内存指针应当这样移动
4, 4, -7, 4, 4, -7, 4, 4, 7, 4, 4，然而此时计算机只能支持固定的步幅，无法记忆-7，7，故这样的逻辑数组是不被支持的，无法做到基于不变的内存数据仍以固定的步幅访问下一个元素，遂报错。

在pytorch中文文档说到一个tensor必须是连续的，才能使用view函数。事实上是不对的，根据最新的英文文档和笔者的实际实践，非连续的tensor也可以使用view函数。比如：

>>>a = torch.arange(12).reshape(3,4)
>>>a
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
>>>b = a.T
>>>b
tensor([[ 0,  4,  8],
       	[ 1,  5,  9],
       	[ 2,  6, 10],
        [ 3,  7, 11]])
>>>c = b.view((2,2,3))
>>>c
tensor([[[ 0,  4,  8],
         [ 1,  5,  9]],
        [[ 2,  6, 10],
         [ 3,  7, 11]]])
>>>b.shape, b.stride()
(torch.Size([4, 3]), (1, 4))
>>>c.shape,c.stride()
(torch.Size([2, 2, 3]), (2, 1, 4))

在英文文档中，一个tensor b，能否成功执行b.view(shape), 它归纳出以下条件：

新的shape中的各个维度的值，

要么就是原始tensor的shape中的值(如上面的3)
要么满足下面的条件，剩下的维度 $d_0,d_1...d_k$ ，∀i=0,…,k−1, 相应的步幅满足：
$s t r i d e [i] = s t r i d e [i + 1] \times s i z e [i + 1]$
比如上面c的shape，3排除后，剩下[2,2]，只需要第一个2对应的stride满足stride[i]=stride[i+1]×size[i+1]即可。

所以非连续的tensor能不能进行view，要看在新的shape的条件下，我们能不能求得新的步幅支持顺序访问目标形状的tensor。在某些情况下非连续的tensor b不能进行view的症结就在于目前的tensor b已经是逻辑顺序和物理顺序不匹配，在目前的逻辑顺序上再做一次逻辑抽象，就可能会得不到一个线性映射。