一、numpy布尔索引掩码
import numpy as np
data = np.arange(1, 11)
mask=[True,False,True,False,True,False,True,False,True,False]
print(data)
print(data[mask])
返回值为:
[ 1 2 3 4 5 6 7 8 9 10]
[1 3 5 7 9]
二、numpy掩码数组
掩码数组通过numpy.ma来创建。
所谓掩码,就是掩盖的意思,后续掩码数组的操作只有未被掩藏的元素会参与计算。
掩码数组赋予了我们重新选择元素的权利,而不用改变矩阵的维度。
示例一:
import numpy as np
import numpy.ma as ma
a = np.arange(5)
b = ma.masked_array(a, mask=[1,1,1,0,0])
print(a)
print(b)
返回值为:
[0 1 2 3 4]
[-- -- -- 3 4]
示例二:
import matplotlib.pyplot as plt
data = np.random.rand(25 * 25).reshape(25, -1)
mask = np.tri(data.shape[0], k=-1)
data_masked = ma.array(data, mask=mask)
fig, (ax1, ax2) = plt.subplots(1, 2)
ax1.imshow(data)
ax2.imshow(data_masked)
plt.show()
返回为:
三、pytorch掩码
pytorch使用tensor.masked_fill将张量中的一些值掩盖掉。
方法原型:tensor.masked_fill(mask, value)
注意点:
- mask中为1的部分使用value替代,0的部分保持原值
- mask必须是一个ByteTensor类型的张量(由01组成)
import torch
x = torch.arange(24).reshape(3, 2, 4)
print(x.shape)
masked = torch.ByteTensor([[[1, 0, 1, 0], [0, 1, 1, 1]],
[[1, 0, 1, 0], [0, 1, 1, 1]],
[[1, 0, 1, 0], [0, 1, 1, 1]]])
print(masked.shape)
x = x.masked_fill(masked, 1e9)
print(x)
返回为:
torch.Size([3, 2, 4])
torch.Size([3, 2, 4])
tensor([[[1000000000, 1, 1000000000, 3],
[ 4, 1000000000, 1000000000, 1000000000]],
[[1000000000, 9, 1000000000, 11],
[ 12, 1000000000, 1000000000, 1000000000]],
[[1000000000, 17, 1000000000, 19],
[ 20, 1000000000, 1000000000, 1000000000]]])