scatter_()函数的详细介绍

最新推荐文章于 2023-11-04 23:48:08 发布

DRACO于

最新推荐文章于 2023-11-04 23:48:08 发布

阅读量7.3k

点赞数 4

分类专栏： python基础学习 pytorch 文章标签：深度学习

本文链接：https://blog.csdn.net/chanbo8205/article/details/114693720

版权

pytorch 同时被 2 个专栏收录

23 篇文章 2 订阅

订阅专栏

python基础学习

18 篇文章 0 订阅

订阅专栏

scatter() 和 scatter_() 的作用是一样的，只不过 scatter() 不会直接修改原来的 Tensor，而 scatter_() 会。

PyTorch 中，一般函数加下划线代表直接在原来的 Tensor 上修改

scatter_(input, dim, index, src)：将src中数据根据index中的索引按照dim的方向填进input。可以理解成放置元素或者修改元素

dim：沿着哪个维度进行索引
index：用来 scatter 的元素索引
src：用来 scatter 的源元素，可以是一个标量或一个张量

官方文档给出了 3维张量的具体操作说明，如下所示

self[index[i][j][k]][j][k] = src[i][j][k]  # if dim == 0
self[i][index[i][j][k]][k] = src[i][j][k]  # if dim == 1
self[i][j][index[i][j][k]] = src[i][j][k]  # if dim == 2

dim=0。LongTensor的shape刚好与x的shape对应，也就是LongTensor每个index指定x中一个数据的填充位置。dim=0，表示按行填充，主要理解按行填充。

src = torch.rand(2, 5)
 
#tensor([[0.1940, 0.3340, 0.8184, 0.4269, 0.5945],
#        [0.2078, 0.5978, 0.0074, 0.0943, 0.0266]])

y=torch.zeros(3, 5)

index=torch.LongTensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]])

y1 = y.scatter_(0, index, src)
 

# tensor([[0.1940, 0.5978, 0.0074, 0.4269, 0.5945],
#        [0.0000, 0.3340, 0.0000, 0.0943, 0.0000],
#        [0.2078, 0.0000, 0.8184, 0.0000, 0.0266]])

简单来说，通过一个张量 src 来修改另一个张量，哪个元素需要修改、用 src 中的哪个元素来修改由 dim 和 index 决定。

如例，输出y1第一个元素（0，0），需要index(0,0)=0和src(0,0)，src(0,0)代替y1（index(0,0)，0）的值。同理，dim=1，替换的是y1（0，index(0,0)）的值。

LongTensor中的第1行第0列的值为2，即索引index=2，表示在第2行（从0开始）进行填充，对应到zeros(3, 5)中就是位置（2,0）。所以此处要求zeros(3, 5)的列数要与x列数相同，LongTensor中的index最大值应与zeros(3, 5)行数相一致，示意图如下。

dim=1 。此处按列填充，LongTensor中的index=2对应zeros(2, 4)的(0,2)位置

>>> z = torch.zeros(2, 4).scatter_(1, torch.LongTensor([[2], [3]]), 1.23)
>>> z

 0.0000  0.0000  1.2300  0.0000
 0.0000  0.0000  0.0000  1.2300
[torch.FloatTensor of size 2x4]

src 除了可以是张量外，也可以是一个标量

torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), 7)

#tensor([[7., 7., 7., 7., 7.],
#        [0., 7., 0., 7., 0.],
#        [7., 0., 7., 0., 7.]]

scatter() 一般可以用来对标签进行 one-hot 编码，这就是一个典型的用标量来修改张量的一个例子

class_num = 10
batch_size = 4
label = torch.LongTensor(batch_size, 1).random_() % class_num
#tensor([[6],
#        [0],
#        [3],
#        [2]])
torch.zeros(batch_size, class_num).scatter_(1, label, 1)
#tensor([[0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
#        [1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
#        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
#        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.]])

参考：

https://www.cnblogs.com/dogecheng/p/11938009.html

https://www.cnblogs.com/shiyublog/p/10924287.html