Python 进阶系列笔记文章链接:
Python 进阶学习笔记之一:内置常用类型及方法
Python 进阶学习笔记之二:常用数据类型(上)
Python 进阶学习笔记之三:常用数据类型(下)
Python 进阶学习笔记之四:高效迭代器工具
Python 进阶学习笔记之五:异步 IO
Python 进阶学习笔记之六:多线程编程
Python 进阶学习笔记之七:互联网支持
Python 进阶学习笔记之八:面向对象高级编程
Python 进阶学习笔记之九:IO 编程
Python 进阶学习笔记之十:一般加密支持
Python 进阶学习笔记之十一:日志支持
Python 进阶学习笔记之十二:数据压缩与归档
本篇文章接上篇文章,但可以单独阅读。
8. heapq — 堆队列算法
这个模块提供了堆队列算法的实现,也称为优先队列算法。堆是一个二叉树,它使用了数组来实现:从零开始计数,对于所有的 k ,都有 heap[k] <= heap[2k+1] 和 heap[k] <= heap[2k+2] 。
这个模块中,原生的 list 就可以看作是堆形式。要创建一个堆,可以使用list来初始化为 [] ,或者你可以通过函数 heapq.heapify() ,来把一个list转换成堆。
模块中提供的方法包括:
heapq.heappush(heap, item)
:将 item 的值加入 heap 中,保持堆的不变性。其中参数heap其实就是一个listheapq.heappop(heap)
:弹出并返回 heap 的最小的元素,保持堆的不变性。如果堆为空,抛出 IndexError 。使用 heap[0] ,可以只访问最小的元素而不弹出它。heapq.heappushpop(heap, item)
:将 item 放入堆中,然后弹出并返回 heap 的最小元素。该组合操作比先调用 heappush() 再调用 heappop() 运行起来更有效率。heapq.heapify(x)
:将list x 转换成堆,原地,线性时间内。heapq.heapreplace(heap, item)
:从heap中弹出最小值,然后把item push进heap,如果heap为空,则会报IndexError。这个方法有一个情况需要注意,就是可能弹出的值比item还大,如果要避免这种情况,推荐使用heappushpop
,它总会返回一个最小值。heapq.merge(*iterables, key=None, reverse=False)
:合并多个iter,并从小到大排序后返回,当然reverse=True的话,会是从大到小,key可以指定一个item处理方法。heapq.nlargest(n, iterable, key=None)
:从指定的iterable中返回前 N 大的结构,key可以指定一个item处理函数。heapq.nsmallest(n, iterable, key=None)
:从指定的iterable中返回前 N 小的结构,key可以指定一个item处理函数。
这个模块的方法使用都比较简单,下面写几个简单的例子展示一下:
>>> import heapq
>>> h = [9,8,7,1,2,3,6,10]
>>> h[0]
9
>>> heapq.heapify(h) # 列表h被转成了堆
>>> h[0] # 访问堆的最小值
1
>>> heapq.heappop(h) # 弹出堆的最小值
1
>>> h[0]
2
>>> heapq.nlargest(2, h) # 返回最大的两个值
[10, 9]
>>> h
[2, 8, 3, 10, 9, 7, 6]
>>>
需要注意的是,上面代码中列表 h 本身并不会改变,只是使用优先队列算法对其进行操作。
9. bisect — 数组二分查找算法
这个模块对有序列表提供了支持,使得他们可以在插入新数据仍然保持有序。对于长列表,如果其包含元素的比较操作十分昂贵的话,这可以是对常见方法的改进。
模块提供一下方法:
bisect.bisect_left(a, x, lo=0, hi=len(a))
:在列表 a 中找到 x 合适的插入点以维持有序,返回这个点的索引,如果 a 中存在与 x 相等的值,返回其相等值左侧的索引。要注意,实际只是查询合适的插入点。bisect.bisect_right(a, x, lo=0, hi=len(a))
:在列表 a 中找到 x 合适的插入点以维持有序,返回这个点的索引,如果 a 中存在与 x 相等的值,返回其相等值右侧的索引。<