pytroch中最清晰明白的dim 张量维数讲解

znsoft

已于 2024-08-20 08:38:54 修改

阅读量6k

点赞数 24

文章标签：人工智能

于 2020-02-18 22:38:47 首次发布

原文链接：https://www.cnblogs.com/flix/p/11262606.html

版权

Pytorch 中的 dim

Pytorch 中对 tensor 的很多操作如 sum、argmax、unsqueeze 等都可以设置 dim 参数用来指定操作在哪一维进行。Pytorch 中的 dim 类似于 numpy 中的 axis，这篇文章来总结一下 Pytorch 中的 dim 操作。

dim 与方括号的关系#

创建一个矩阵

a = torch.tensor([[1, 2], [3, 4]]) print(a)

输出

tensor([[1, 2], [3, 4]])

因为a是一个矩阵，所以a的左边有 2 个括号

括号之间是嵌套关系，代表了不同的维度。从左往右数，两个括号代表的维度分别是 0 和 1 ，在第 0 维遍历得到向量，在第 1 维遍历得到标量

同样地，对于 3 维 tensor

b = torch.tensor([[[3, 2], [1, 4]], [[5, 6], [7, 8]]]) print(b)

输出

tensor([[[3, 2], [1, 4]], [[5, 6], [7, 8]]])

则 3 个括号代表的维度从左往右分别为 0, 1, 2，在第 0 维遍历得到矩阵，在第 1 维遍历得到向量，在第 2 维遍历得到标量

更详细一点

在指定的维度上进行操作#

在某一维度求和（或者进行其他操作）就是对该维度中的元素进行求和。
对于矩阵 a

a = torch.tensor([[1, 2], [3, 4]]) print(a)

输出

tensor([[1, 2], [3, 4]])

求 a 在第 0 维的和，因为第 0 维代表最外边的括号，括号中的元素为向量[1, 2]，[3, 4]，第 0 维的和就是第 0 维中的元素相加，也就是两个向量[1, 2]，[3, 4]相加，所以结果为

[1,2]+[3,4]=[4,6][1,2]+[3,4]=[4,6]

s = torch.sum(a, dim=0) print(s)

输出

Copy

tensor([4, 6])

可以看到，a 是 2 维矩阵，而相加的结果为 1 维向量，可以使用参数keepdim=True来保证形状不变

Copy

s = torch.sum(a, dim=0, keepdim=True) print(s)

输出

Copy

tensor([[4, 6]])

在 a 的第 0 维求和，就是对第 0 维中的元素（向量）进行相加。同样的，对 a 第 1 维求和，就是对 a 第 1 维中的元素（标量）进行相加，a 的第 1 维元素为标量 1，2 和 3，4，则结果为

[1+2]=[3], [3+4]=[7][1+2]=[3], [3+4]=[7]

Copy

s = torch.sum(a, dim=1) print(s)

输出

Copy

tensor([3, 7])

保持维度不变

Copy

s = torch.sum(a, dim=1, keepdim=True) print(s)

输出

Copy

tensor([[3], [7]])

对 3 维 tensor 的操作也是这样

Copy

b = torch.tensor([[[3, 2], [1, 4]], [[5, 6], [7, 8]]]) print(b)

输出

Copy

tensor([[[3, 2], [1, 4]], [[5, 6], [7, 8]]])

将 b 在第 0 维相加，第 0 维为最外层括号，最外层括号中的元素为矩阵[[3, 2], [1, 4]]和[[5, 6], [7, 8]]。在第 0 维求和，就是将第 0 维中的元素（矩阵）相加

[3124]+[5768]=[88812][3214]+[5678]=[88812]

Copy

s = torch.sum(b, dim=0) print(s)

输出

Copy

tensor([[ 8, 8], [ 8, 12]])

求 b 在第 1 维的和，就是将 b 第 1 维中的元素[3, 2]和[1, 4], [5, 6]和 [7, 8]相加，所以

[3,2]+[1,4]=[4,6],[5,6]+[7,8]=[12,14][3,2]+[1,4]=[4,6],[5,6]+[7,8]=[12,14]

Copy

s = torch.sum(b, dim=1) print(s)

输出

Copy

tensor([[ 4, 6], [12, 14]])

则在 b 的第 2 维求和，就是对标量 3 和 2, 1 和 4, 5 和 6 , 7 和 8 求和

Copy

s = torch.sum(b, dim=2) print(s)

结果为

Copy

tensor([[ 5, 5], [11, 15]])

除了求和，其他操作也是类似的，如求 b 在指定维度上的最大值

Copy

m = torch.max(b, dim=0) print(m)

b 在第 0 维的最大值是第 0 维中的元素（两个矩阵[[3, 2], [1, 4]]和[[5, 6], [7, 8]]）的最大值，取矩阵对应位置最大值即可
结果为

Copy

torch.return_types.max( values=tensor([[5, 6], [7, 8]]), indices=tensor([[1, 1], [1, 1]]))

b 在第 1 维的最大值就是第 1 维元素（4 个（2对）向量）的最大值

Copy

m = torch.max(b, dim=1) print(m)

输出为

Copy

torch.return_types.max( values=tensor([[3, 4], [7, 8]]), indices=tensor([[0, 1], [1, 1]]))

b 在第 0 维的最大值就是第 0 为元素（8 个（4 对）标量）的最大值

Copy

m = torch.max(b, dim=2) print(m)

输出

Copy

torch.return_types.max( values=tensor([[3, 4], [6, 8]]), indices=tensor([[0, 1], [1, 1]]))

总结#

在 tensor 的指定维度操作就是对指定维度包含的元素进行操作，如果想要保持结果的维度不变，设置参数keepdim=True即可。

作者： Flix

出处：https://www.cnblogs.com/flix/p/11262606.html

本站使用「CC BY 4.0」创作共享协议，转载请在文章明显位置注明作者及出处。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。