pytorch中torch.masked_select()总结

  • 1. 官方文档:

 

  • 2. 当input 为 二维tensor时:

实例:

import torch

a = torch.randn(3,4)
mask = torch.ByteTensor([[1,1,1,0],[1,0,0,0],[0,0,0,0]])
b = torch.masked_select(a,mask)
print('a:',a)
print('mask:',mask)
print('b:',b) 

会发现,输入的tensor a 会根据 mask 对应位置的值 进行删选, 最后输出一个1维的tensor.

但此时出现了一个UserWarning: masked_select received a mask with dtype torch.uint8, this behavior is now deprecated,please use a mask with dtype torch.bool instead.

所以,可以进行如下改进:

import torch

a = torch.randn(3,4)
mask = torch.tensor([[1,1,1,0],[1,0,0,0],[0,0,0,0]],dtype=torch.bool)
b = torch.masked_select(a,mask)
print('a:',a)
print('mask:',mask)
print('b:',b) 

此时,就没有warning了.

 

注意: 官方文档说 mask 跟 input 有相同数量的元素数目, 但形状或维度不需要相同,     此处经实验发现有误, mask 和 input 需保证维度相同,否则会报错.

import torch

a = torch.randn(3,4)
mask = torch.tensor([[1,1,1,0,1,0],[0,0,0,0,0,0]],dtype=torch.bool)
b = torch.masked_select(a,mask)
print('a:',a)
print('mask:',mask)
print('b:',b) 

 

  • 3. 当tensor 为多维tensor(比如三维)时:

比如, 考虑如下实际应用场景:  简单化, 二分类问题, 判断每个字后面的韵律是0还是1(实际上, 韵律要分#0, #1, #2, #3, #4这五种), 每个batch_size=3,即有3句话, 按照这三句话中的最长的句子进行padding成等长, 但是在计算loss时 要将padding的字进行mask掉, 得到真正的每个字

一般思路为: 先根据每个batch里的每句话的长度 得到一个二维的mask, 但是字符的tensor是三维的(其中第一维是句子数, 第二维是每句话的字数, 最后一维是每个字对应0或1的概率), 二者不匹配, 无法直接用函数 torch.masked_selected(input, mask) 进行mask, 所以, 要先用unsqueeze(-1)给mask增加第三维, 然后再用torch.masked_select()进行mask, 得到一维的概率值, 最后再用reshape(-1,2) 得到二维的tensor, 即每个字的属于0 或1的概率组成的tensor.

具体如下:

import torch

a = torch.randn(3,4,2)
print('a:',a)
print('a.shape:',a.shape)
mask1 = torch.tensor([[1,1,1,0],[1,0,0,0],[0,0,0,0]],dtype=torch.bool)
print('mask1:',mask1)
print('mask1.shape:',mask1.shape)
mask2 = mask1.unsqueeze(-1)
print('mask2:',mask2)
print('mask2.shape:',mask2.shape)
b1 = torch.masked_select(a,mask2)
print('b1:',b1)
print('b1.shape:',b1.shape)
b2 = b1.reshape(-1,2)
print('b2:',b2)
print('b2.shape:',b2.shape)

 

 

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: torch.masked_selectPyTorch 的一个函数,它可以根据给定的 mask(布尔类型的 tensor)来选择输入 tensor 的元素。选的元素将被组合成一个新的 1-D tensor,并返回。例如: ``` import torch x = torch.randn(3, 4) mask = x.ge(0) y = torch.masked_select(x, mask) ``` 在这个例子mask 是一个大小为 (3, 4) 的 tensor,其包含 x 每个元素是否大于等于 0 的布尔值, y 是一个 1-D tensor,其包含了 x 所有大于等于 0 的元素。 ### 回答2: torch.masked_selectPyTorch的一个函数,用于根据给定的掩码(mask)从输入张量选择元素。掩码是一个布尔张量,与输入张量具有相同的形状。 具体来说,torch.masked_select会返回一个新的一维张量,并包含输入张量满足掩码为True的元素。返回的张量的元素顺序与输入张量的顺序保持一致。 使用torch.masked_select时,需要传入两个参数:输入张量和掩码。例如,如果有一个大小为(3, 3)的输入张量t和一个与其形状相同的掩码m,我们可以这样使用torch.masked_select: output = torch.masked_select(t, m) 返回的output就是满足掩码m为True的元素组成的一维张量。 需要注意的是,输入张量和掩码的形状必须是一致的,否则会引发错误。此外,如果掩码的元素数量与输入张量的元素数量不匹配,也会引发错误。 torch.masked_select函数在很多情况下都很有用,比如在计算损失函数时,可以根据掩码选择特定的预测值和目标值。此外,它还可以用于过滤数据,只保留满足特定条件的元素。 总之,torch.masked_select是一个用于根据掩码从输入张量选择元素的函数,返回的是由满足掩码为True的元素组成的一维张量。 ### 回答3: torch.masked_select是一个函数,用于提取符合指定mask条件的元素。它的输入是一个tensor和一个布尔类型的mask tensor,输出是一个一维的tensor,其包含了满足mask条件的元素。 具体来说,假设输入的tensor是A,形状为(M,N),mask tensor是mask,形状也为(M,N)。对于A的每个元素,如果对应位置上的mask值为True,则该位置的元素会被保留,否则被忽略。输出的tensor的形状取决于满足mask条件的元素个数,它的长度为满足条件的元素个数。 这个函数在实际应用非常有用,例如在计算机视觉任务,可以使用它来提取指定类别的目标物体的特征向量。另外,在自然语言处理,可以利用它来提取包含特定关键词的文本。 总的来说,torch.masked_select函数提供了一种快速有效地提取满足条件元素的方法,可以在各种深度学习任务发挥重要作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值