【Python】heapq—nlargest()和nsmallest()用法解析

Python的heapq模块提供了nlargest和nsmallest函数,用于高效找出列表中的最大或最小N个元素。当N远小于列表大小时,它们比排序更有效。heapq还支持通过key参数自定义比较规则。对于寻找单个最大或最小值,min()和max()更快;若N接近列表大小,排序后切片可能更优。
摘要由CSDN通过智能技术生成

【Python】heapq—nlargest()和nsmallest()用法解析

1. 介绍

1)这两个函数可以帮助我们在某个集合中找出最大或最小的N个元素。例如:

>>> import heapq
>>> nums=[1,8,2,23,7,-4,18,23,42,37,2]
>>> print(heapq.nlargest(3,nums))
[42, 37, 23]
>>> print(heapq.nsmallest(3,nums))
[-4, 1, 2]

2)如果正在寻找最大或者最小的N个元素,且同集合中元素的总数目相比,N很小,那么下面这些函数就可以提供更好的性能。这些函数首先会在底层将数据转化成列表,且元素会以堆得顺序排列。例如:

>>> nums=[1,8,2,23,7,-4,18,23,42,37,2]
>>> import heapq
>>> heap=list(nums)
>>> heapq.heapify(heap)#将列表原地转换成堆
>>> heap
[-4, 2, 1, 23, 7, 2, 18, 23, 42, 37, 8]

3)堆最重要的特性就是,heap[0]总是最小的那个元素,此外,接下来的最小元素可以一次通过heapq.heappop()的方法轻松的找到。该方法会将第一个元素(最小的)弹出,然后以第二小的元素取而代之。例如,要找到第三小的元素,可以这样做:

>>> heapq.heappop(heap)
-4
>>> heapq.heappop(heap)
1
>>> heapq.heappop(heap)
2

4)使用key,来选取哪个位置做大小比较

predict = {idx: score for idx, score in enumerate(pred)}
pred_dict = heapq.nlargest(5, pred_dict.items(), key=lambda kv :kv[1])

2. 比较

  • 当要查找的元素个数相对比较小的时候,函数nlargest()和 nsmallest()是很合适的。

  • 如果你仅仅想查找唯一的最小或最大(N=1)的元素的话,那么使用 min()和max()函数会更快些。

  • 类似的,如果 N 的大小和集合大小接近的时候,通常先排序这个集合然后再使用切片操作会更快点
    (sorted(items)[:N] 或者是 sorted(items)[-N:])。

  • 需要在正确场合使用函数nlargest() 和nsmallest()才能发挥它们的优势(如果 N 快接近集合大小了,那么使用排序操作会更好些)。

  • 尽管你没有必要一定使用这里的方法,但是堆数据结构的实现是一个很有趣并且值得你深入学习的东西。 基本上只要是数据结构和算法书籍里面都会有提及到。 heapq 模块的官方文档里面也详细的介绍了堆数据结构底层的实现细节。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

秋冬无暖阳°

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值