1. 问题说明
统计一维数组中重复元素的数量是个常见的问题,那么拓展到二维或者更高维度,这个问题依然是常见的。有什么方法能快速解决这个问题呢?请接着往下看,代码就在下边。
2. 解决之道
numpy中的unique可以用来统计重复元素的个数,但是看网上有些资料说只适用于一维数组(如下图)。
事实果真如此吗?
我使用百度仔细检索发现了一篇很有用的文章,发现上图中说的是错误的,文章里边提到了怎么统计二维空间中重复点的数量。下边展示一下代码:
import numpy as np
a = np.array(
[
[1, 0, 0],
[1, 0, 0],
[1, 0, 0],
[2, 3, 4]
]
)
unique, unique_counts = np.unique(
a.view(a.dtype.descr * a.shape[1]),
return_counts=True
)
运行结果如下图:
说实话我看不懂view那一行是怎么个意思,但是我大受震撼。原来numpy可以如此强大!
哪位高人懂的可以在评论区指点一下。
3. 向原作者致敬
贴出原作图片,原文链接放在Reference的第一条,侵删。
Reference
- common&Y博主的很有用的文章:Python中numpy库unique函数解析
- numpy.unique
- numpy.ndarray.view
- numpy.dtype.descr