这是一个掩盖数组的工作,numpy.ma有很多用于处理子集的函数.
a = np.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'
让我们掩盖不是空元素:
am=np.ma.masked_where(a!='', a)
np.ma.notmasked_contiguous遍历数组(非常有效)并找到数组未被屏蔽的所有连续元素切片:
slices = np.ma.notmasked_contiguous(am)
[slice(0, 1, None), slice(3, 3, None), slice(5, 7, None), slice(9, 9, None)]
因此,例如,阵列在元素5和7之间连续地为空.
现在你只需加入你感兴趣的切片,首先得到每个切片的起始索引:
slices_start = np.array([s.start for s in slices])
然后你得到你正在寻找的索引的位置:
slices_start.searchsorted(4) #4
Out: 2
所以你想要切片1和2:
a [slices [1] .start:slices [2] .stop 1]
数组([”,’X’,”,”,”],
D型= ‘| S1’)
或者让我们试试8:
i = slices_start.searchsorted(8)
a[slices[i-1].start:slices[i].stop+1]
Out: array(['', '', '', 'B', ''],
dtype='|S1')
如果应该在ipython中使用它可以更好地理解它.