假设我有一个像这样的二维数组
numpy.array(
[[0,1,1.2,3],
[1,5,3.2,4],
[3,4,2.8,4],
[2,6,2.3,5]])
我希望有一个数组,根据最后一列的值的唯一性消除整行,根据第三列的值选择要保留的行.
例如在这种情况下,我想只保留其中一行作为最后一列4,并选择具有第三列的次要值的行,结果是这样的:
array([0,1,1.2,3],
[3,4,2.8,4],
[2,6,2.3,5])
从而消除了行[1,5,3.2,4]
这将是最好的方式吗?
最佳答案 我的numpy已经失去了实践,但这应该有效:
#keepers is a dictionary of type int: (int, int)
#the key is the row's final value, and the tuple is (row index, row[2])
keepers = {}
deletions = []
for i, row in enumerate(n):
key = row[3]
if key not in keepers:
keepers[key] = (i, row[2])
else:
if row[2] > keepers[key][1]:
deletions.append(i)
else:
deletions.append(keepers[key][0])
keepers[key] = (i, row[2])
o = numpy.delete(n, deletions, axis=0)
我已经从我的声明性解决方案中大大简化了它,它变得非常笨拙.希望这更容易理解;我们所做的就是维护一个我们想要保留的值字典和一个我们想要删除的索引列表.