理解torch.scatter_()

最新推荐文章于 2024-05-29 12:42:26 发布

lifeplayer_

最新推荐文章于 2024-05-29 12:42:26 发布

阅读量8.7k

点赞数 46

分类专栏： pytorch 文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/lifeplayer_/article/details/111561685

版权

pytorch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

理解torch.scatter_()

官方文档

scatter_(dim, index, src): 将src中所有的值分散到self 中，填法是按照index中所指示的索引来填入。

dim用来指定index进行映射的维度，其他维度则保持不变。

Note: src可以是一个scalar。在这种情况下，该函数的操作是根据index来散布单个值。

当dim=0

dim=0，意味着在src按照index行索引的指示来进行散射，换言之，src的j列按照index

的j列中的值散射到self的j列中。（表述还是很绕，看例子吧）

以下是官方的例子：

>>> x = torch.rand(2, 5)
>>> x
tensor([[ 0.3992,  0.2908,  0.9044,  0.4850,  0.6004],
        [ 0.5735,  0.9006,  0.6797,  0.4152,  0.1732]])
>>> torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), x)
tensor([[ 0.3992,  0.9006,  0.6797,  0.4850,  0.6004],
        [ 0.0000,  0.2908,  0.0000,  0.4152,  0.0000],
        [ 0.5735,  0.0000,  0.9044,  0.0000,  0.1732]])

因为dim=0，所以是列映射到列，散射操作可以按列依次进行。

第一列：
在这里插入图片描述
第二列：

直到最后一列：

当dim = 1

dim=1，意味着在src按照index列索引的指示来进行散射，换言之，src的i行按照index

的i行中的值散射到self的i列中。

>>> src = torch.from_numpy(np.arange(1, 11)).float().view(2, 5)
>>> input_tensor = torch.zeros(3, 5)
>>> index_tensor = torch.tensor([[3, 0, 2, 1, 4], [2, 0, 1, 3, 1]])
>>> dim = 1
>>> input_tensor.scatter_(dim, index_tensor, src)
tensor([[ 2.,  4.,  3.,  1.,  5.],
        [ 7., 10.,  6.,  9.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]])

散射操作前：
在这里插入图片描述
更新第一行：

更新第二行，可以看到index中出现重复的映射索引值1，因此后一个会把前一个覆盖:

8和10都是映射到col1，可以看到10把8给覆盖了。

当src是scalar

>>> input_tensor = torch.from_numpy(np.arange(1, 16)).float().view(3, 5) # dim is 2
>>> # unsqueeze to have dim = 2
>>> index_tensor = torch.tensor([4, 0, 1]).unsqueeze(1) 
>>> src = 0
>>> dim = 1
>>> input_tensor.scatter_(dim, index_tensor, src)
tensor([[ 1.,  2.,  3.,  4.,  0.],
        [ 0.,  7.,  8.,  9., 10.],
        [11.,  0., 13., 14., 15.]])

Note:

index的维度要和输入张量的维度保持一致。同时index要在相同维度上的尺度不能大于输入张量。
当src是标量时，我们实际上使用的是广播版本，其形状与index张量相同。

代码实操

该函数最常用的场景是把标量的标签转换为one-hot编码

batch_size = 4
class_num = 5
labels = torch.tensor([4, 0, 1, 2]).unsqueeze(1)
one_hot = torch.zeros(batch_size, class_num)
dim=1; index_tensor = labels; src=1
one_hot.scatter_(dim, index_tensor, src)
print(one_hot)
> tensor([[0., 0., 0., 0., 1.],
        [1., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0.],
        [0., 0., 1., 0., 0.]])

References:

Understand torch.scatter_()
https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_

lifeplayer_

关注

46
点赞
踩
79

收藏

觉得还不错? 一键收藏
9
评论
理解torch.scatter_()

理解torch.scatter_()官方文档scatter_(dim, index, src): 将src中所有的值分散到self 中，填法是按照index中所指示的索引来填入。dim用来指定index进行映射的维度，其他维度则保持不变。Note: src可以是一个scalar。在这种情况下，该函数的操作是根据index来散布单个值。当dim=0dim=0，意味着在src按照index行索引的指示来进行散射，换言之，src的j列按照index的j列中的值散射到self的j列中。（表述还是很绕，
复制链接

扫一扫