mask(掩码、掩膜)是深度学习中的常见操作。简单而言,其相当于在原始张量上盖上一层掩膜,从而屏蔽或选择一些特定元素,因此常用于构建张量的过滤器。
mask在图像和自然语言处理中都广为应用,但在这里仅做一个较为基础的尝试,可代替for循环与if条件判断遍历数组并完成对数组的处理。
如:有一个一维数组[1, 2, 3, 4, 5, 6, 7, 8, 9],我们希望数组内小于5的值重新赋值为0。
常规方法:利用enumerate() 函数遍历对象
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
for i, num in enumerate(a):
if num < 5:
a[i] = 0
print(a)
#输出[0 0 0 0 5 6 7 8 9]
利用mask操作:
mask = a < 5
a[mask] = 0
print(a)
# 输出[0 0 0 0 5 6 7 8 9]
# mask是一个bool类型的矩阵
print(mask)
# 输出[ True True True True False False False False False]
# 二维数组操作同理 实例如下:
a = np.array([[0, 1], [0, 2], [0, 3]])
mask = a[:, 1] > 1
a[:, 1][mask] = a[:, 1][mask] + 1
print(a)
# 输出:
[[0 1]
[0 3]
[0 4]]
通过该方法完成对数组的操作仅在条件满足时(True)执行,在数据量大时避免对逐个数据进行遍历判断后再操作,提升代码效率。