numpy.partition的用法

最新推荐文章于 2023-07-22 22:59:38 发布

weixin_42001089

最新推荐文章于 2023-07-22 22:59:38 发布

阅读量1.2w

点赞数 12

分类专栏： python 文章标签： numpy K最值 python

本文链接：https://blog.csdn.net/weixin_42001089/article/details/89204112

版权

python 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

功能

np.partition的工作流程可以看做是先对数组排序（升序），然后以索引是i的元素为基准，将元素分成两部分，即大于该元素的放在其后面，小于该元素的放在其前面，这里有点类似于快排，具体看下面的类子：

import numpy as np
result = np.random.randint(1, 13,(6,4))
print(result)
result1 = np.sort(result,axis=0)
print(result1)
result2 = np.partition(result, kth=2, axis=0)
print(result2)

这里我们是按列（axis=0）进行的排序

为了验证我们的想法先对原始二维数组进行排序得到result1

然后以每一列索引为2即第3个元素进行基准将每一列划分为两部分

比如第一列排序后的第三个元素是7，那么大于它的都放在了其后面，小于其的都放在了其前面

同理第二列排序后的第三个元素是8

第三列排序后的第三个元素是3等等

还有一个问题需要注意的就是放在其后或其前的数组是无序的如第一列的10,10,8

它通常的应用是找出最值

假设现在我们找每一列第二小的数，我们就可以这么做：

import numpy as np
result = np.random.randint(1, 13,(6,4))
print(result)
result1 = np.sort(result,axis=0)
print(result1)
result2 = np.partition(result, kth=1, axis=0)[1]
print(result2)

当然啦，其没有考虑去重的情况，即比如第二列按说只有2,4,6,11,12这几种数据，第二小的数据是4

同理我们还可以选取每一列第二大的数据：

import numpy as np
result = np.random.randint(1, 13,(6,4))
print(result)
result1 = np.sort(result,axis=0)
print(result1)
result2 = np.partition(result, kth=-2, axis=0)[-2]
print(result2)