如下:
import numpy as np
from numpy.ma import masked_array
data = masked_array(data = [7, 0, 7, 1, 8, 0, 1, 1, 0, 0, 3, 0, 0, 3, 0],
mask = [False, True, False, False, False, True, False, False, True, True, False, True, True, False, True])
flag = masked_array(data = [True, False, False, True, 0, 0, 0, False, 0, True, 0, 0, 0, 0, True],
mask = [False, False, False, False, True, True, True, False, True, False, True, True, True, True, False])
print(repr(data))
print(repr(flag))
indices = np.where(flag & ~flag.mask)
print(data[indices])
注意,如果flag中的屏蔽值无法与&进行比较,则可能会遇到麻烦,但对您来说情况并非如此。
输出:
masked_array(data = [7 -- 7 1 8 -- 1 1 -- -- 3 -- -- 3 --],
mask = [False True False False False True False False True True False True True False True],
fill_value = 999999)
masked_array(data = [1 0 0 1 -- -- -- 0 -- 1 -- -- -- -- 1],
mask = [False False False False True True True False True False True True True True False],
fill_value = 999999)
[7 1 -- --]
编辑:
获取指数的另一种方法可能是:
indices = np.where(flag.filled(False))
更新(编辑2):
注意使用数组索引数组的细微之处。
请考虑以下代码:
import numpy as np
data = np.array([1,2,3,4,5])
mask = np.array([True, False, True, False, True])
res = data[mask]
print(res)
正如您可能(或可能不会)所期望的那样,这里的掩码用作“过滤器”,过滤掉掩码中相应位置为False的数据元素。由于我为data和mask选择的值,效果是索引用于过滤掉偶数data值,只留下奇数值。
此处的输出为:[1 3 5]。
现在,请考虑非常 类似的代码:
import numpy as np
data = np.array([1,2,3,4,5])
mask = np.array([1, 0, 1, 0, 1])
res = data[mask]
print(res)
这里,唯一改变的是掩码元素的数据类型,它们的布尔值是相同的。让我们调用第一个掩码(由True / False值组成)mask1和第二个掩码(由1 / 0值组成){{1} }。
您可以通过mask2属性(例如dtype)检查数组的数据类型。 print(mask.dtype)的dtype为mask1,而bool的dtype为mask2。
但是,输出结果不同: int32。
这里发生了什么?
实际上,索引的行为会有所不同,具体取决于用于索引的数组的数据类型。如上所述,当“mask”的数据类型为boolean时,它提供过滤功能。但是当“mask”的数据类型是完整的时,它会提供一个“选择”函数,使用索引的元素作为原始数组的索引。
因此,在第二个示例中,由于[2 1 2 1 2]和data[1] = 2,data[0] = 1的结果是一个长度为5的数组,而不是3(在布尔值的情况下)。
换句话说,给出以下代码:
data[mask2]
如果res = data[mask],res的长度将等于掩码的长度。
如果mask.dtype == int,则res的长度将等于掩码中mask.dtype == bool值的数量。
相当不同。
最后,您可以使用True方法将一种数据类型的数组强制转换为另一种数据类型。
演示片段:
astype