torch.repeat()

在写transformer代码的时候见到了torch.repeat()这个函数,关于它的输入输出规格,想到了一个很好记的方法。下面的三段代码就可以帮助理解了。

a = torch.arange(512)
b = a.repeat(1,32)
print(b.shape)
# b:(1,32*512)
a = torch.ones(32,100)
b = a.repeat(1,2,3)
# b:(1,2*32,3*100)
a = torch.ones(32,100)
b = a.repeat(10)
# RuntimeError: Number of dimensions of repeat dims can not be smaller than number of dimensions of tensor

那么在transformer定义position encoding那个步骤中,代码:

positions = torch.arange(inputs.size(1)).repeat(inputs.size(0), 1) + 1

就可以得到position的规格为:(batch_size(也就是inputs.size(0)) * seq_len(也就是inputs.size(1))),表示为:对于每一个样本(句子),都有seq_len个单词,也就是seq_len个position。每一个位置都有其位置编码(d_model维)(等完全掌握了transformer一定要写一个博客)

  • 7
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
引用\[1\]:torch.repeat_interleave()函数可以对张量进行重复扩充。它的功能是重复张量的元素,并返回一个新的张量。输入参数包括input(输入张量)、repeats(重复的次数)和dim(在哪个维度进行重复)。默认情况下,该函数会将输入张量展平为向量,然后将每个元素重复repeats次,并返回重复后的张量。\[1\] 引用\[2\]:torch.repeat()函数也可以对张量进行重复扩充。当参数只有两个时,表示行的重复倍数和列的重复倍数,其中1表示不重复。当参数有三个时,表示通道数的重复倍数、行的重复倍数和列的重复倍数,其中1表示不重复。\[3\] 综上所述,torch.repeat_interleave()函数和torch.repeat()函数都可以用来对张量进行重复扩充,但是它们的参数和功能略有不同。 #### 引用[.reference_title] - *1* *2* [torch.repeat_interleave()函数详解](https://blog.csdn.net/weixin_43823669/article/details/126283277)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Pytorchtorch.repeat()函数解析](https://blog.csdn.net/flyingluohaipeng/article/details/125039368)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值