【每天一点Pytorch】用 gather 分 batch 取 tensor 维度

最新推荐文章于 2023-05-06 15:49:19 发布

yzy_1996

最新推荐文章于 2023-05-06 15:49:19 发布

阅读量1.1k

点赞数

分类专栏： pytorch 文章标签： pytorch batch 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yzy_1996/article/details/126615508

版权

pytorch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

目标需求

我有一个维度是 [512, 20, 128] 的tensor，我希望从512的batch里，每次按照[20] 这一维给定索引，得到一个128维的向量，然后遍历整个batch，最终得到 [512, 128] 的tensor。

如果用循环来实现就很简单：

data = torch.rand([512, 20, 128])   # (batch, idx, embd)
index = torch.randint(20, (512, ))  # (batch,)

for i in range(512):
    tmp = data[i].index_select(0, index[i])
    try:
        out = torch.cat((out, tmp), dim=0)
    except:
        out = tmp

print(out.shape) # [512, 128]

如果不用循环来实现呢？

import torch

data = torch.rand([512, 20, 128])   # (batch, idx, embd)
index = torch.randint(20, (512, ))  # (batch,)

index_new = index[..., None, None].expand(-1, -1, data.shape[2])
out = torch.gather(data, 1, index_new).squeeze()

print(out.shape)

解读代码，index_select很方便，但只能取出一维。题目是先要按512维的顺序取出[20, 128]，然后根据第一个给定索引取出一个128维向量，接着取出第二个[20, 128]，然后根据第二个索引取出一个128维向量，最终得到一个[512, 128]维tensor。

借助gather的话，需要保证data和index的维度一致，因此我们需要对给定的index进行扩充，同时还要对第一维以外的维度进行复制扩充。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

yzy_1996 买杯咖啡，再接再厉

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。