理解torch.scatter_()

理解torch.scatter_()

官方文档

scatter_(dim, index, src): 将src中所有的值分散到self 中,填法是按照index中所指示的索引来填入。

dim用来指定index进行映射的维度,其他维度则保持不变。

Note: src可以是一个scalar。在这种情况下,该函数的操作是根据index来散布单个值。

当dim=0

dim=0,意味着在src按照index行索引的指示来进行散射,换言之,srcj列按照index

j列中的值散射到selfj列中。(表述还是很绕,看例子吧)

以下是官方的例子:

>>> x = torch.rand(2, 5)
>>> x
tensor([[ 0.3992,  0.2908,  0.9044,  0.4850,  0.6004],
        [ 0.5735,  0.9006,  0.6797,  0.4152,  0.1732]])
>>> torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), x)
tensor([[ 0.3992,  0.9006,  0.6797,  0.4850,  0.6004],
        [ 0.0000,  0.2908,  0.0000,  0.4152,  0.0000],
        [ 0.5735,  0.0000,  0.9044,  0.0000,  0.1732]])

因为dim=0,所以是列映射到列,散射操作可以按列依次进行。

第一列:
在这里插入图片描述
第二列:
在这里插入图片描述
直到最后一列:
在这里插入图片描述

当dim = 1

dim=1,意味着在src按照index列索引的指示来进行散射,换言之,srci行按照index

i行中的值散射到selfi列中。

>>> src = torch.from_numpy(np.arange(1, 11)).float().view(2, 5)
>>> input_tensor = torch.zeros(3, 5)
>>> index_tensor = torch.tensor([[3, 0, 2, 1, 4], [2, 0, 1, 3, 1]])
>>> dim = 1
>>> input_tensor.scatter_(dim, index_tensor, src)
tensor([[ 2.,  4.,  3.,  1.,  5.],
        [ 7., 10.,  6.,  9.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]])

散射操作前:
在这里插入图片描述
更新第一行:
在这里插入图片描述
更新第二行, 可以看到index中出现重复的映射索引值1,因此后一个会把前一个覆盖:

8和10都是映射到col1,可以看到10把8给覆盖了。

当src是scalar

>>> input_tensor = torch.from_numpy(np.arange(1, 16)).float().view(3, 5) # dim is 2
>>> # unsqueeze to have dim = 2
>>> index_tensor = torch.tensor([4, 0, 1]).unsqueeze(1) 
>>> src = 0
>>> dim = 1
>>> input_tensor.scatter_(dim, index_tensor, src)
tensor([[ 1.,  2.,  3.,  4.,  0.],
        [ 0.,  7.,  8.,  9., 10.],
        [11.,  0., 13., 14., 15.]])

Note:

  • index的维度要和输入张量的维度保持一致。同时index要在相同维度上的尺度不能大于输入张量。

  • src是标量时,我们实际上使用的是广播版本,其形状与index张量相同。
    在这里插入图片描述

代码实操

该函数最常用的场景是把标量的标签转换为one-hot编码

batch_size = 4
class_num = 5
labels = torch.tensor([4, 0, 1, 2]).unsqueeze(1)
one_hot = torch.zeros(batch_size, class_num)
dim=1; index_tensor = labels; src=1
one_hot.scatter_(dim, index_tensor, src)
print(one_hot)
> tensor([[0., 0., 0., 0., 1.],
        [1., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0.],
        [0., 0., 1., 0., 0.]])
References:
  1. Understand torch.scatter_()

  2. https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_

  • 46
    点赞
  • 79
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
`torch_scatter.scatter_max`函数是PyTorch中的一种scatter函数,用于将输入的Tensor按照指定的维度进行散射操作,并返回指定维度上的元素最大值和对应的索引位置。 该函数的输入包括三个参数:输入Tensor(即要进行散射操作的Tensor)、散射维度dim和索引Tensor(即指定维度上的索引位置)。输出包括两个Tensor:散射后的Tensor和对应的最大值和索引位置。 具体来说,`torch_scatter.scatter_max`函数的操作流程如下: 1. 根据索引Tensor将输入Tensor按照指定维度进行散射操作,得到一个散射后的Tensor。 2. 在指定维度上找到散射后的Tensor中的最大值和对应的索引位置。 3. 返回散射后的Tensor和最大值和索引位置对应的两个Tensor。 值得注意的是,如果输入Tensor中某些元素在指定维度上对应的索引位置相同,那么在散射操作时,这些元素的最大值和索引位置会被更新为最后一个被处理到的元素的最大值和索引位置。 下面是一个简单的示例代码,演示了如何使用`torch_scatter.scatter_max`函数: ```python import torch from torch_scatter import scatter_max # 定义一个输入Tensor x = torch.tensor([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6], [0.7, 0.8, 0.9]]) # 定义一个索引Tensor index = torch.tensor([0, 1, 0]) # 在第一维上进行散射操作,得到散射后的Tensor和最大值和索引位置对应的两个Tensor out, argmax = scatter_max(x, index, dim=0) # 输出结果 print(out) # tensor([[0.7000, 0.8000, 0.9000], [0.4000, 0.5000, 0.6000]]) print(argmax) # tensor([2, 1]) ``` 在上面的示例代码中,我们首先定义了一个3x3的输入Tensor `x`,然后定义了一个长度为3的索引Tensor `index`,表示在第一维上,第一个元素要被散射到第0个位置,第二个元素要被散射到第1个位置,第三个元素要被散射到第0个位置。 之后我们调用`torch_scatter.scatter_max`函数,在第一维上进行散射操作,得到了散射后的Tensor `out`和最大值和索引位置对应的两个Tensor `argmax`。最后我们输出了这两个Tensor的值,可以看到在第一维上,第一个位置对应的最大值为0.7,索引为2,第二个位置对应的最大值为0.5,索引为1。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值