之前写代码用到堆的时候一直在用 C++ STL 的 priority_queue ,这段时间学习 python 顺便实现一下。同时也学习了使用 python 自带的 heapq。堆可以用来写堆排序也可用作优先队列等,虽然现在已经有封装好的模块可供我们调用,但是掌握其实现更有助于我们理解这种数据结构。
堆(heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质:
(1)堆中某个节点的值总是不大于或不小于其父节点的值;
(2)堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
这里以小根堆为例,简单讲解堆的 python 实现。
一、Python实现
堆涉及的比较重要的几个操作有:插入新元素,堆判空,弹出堆顶元素,将一个数组转换为一个堆。
(1)插入新元素
每次执行该操作时应保持堆的性质不变。对于小根堆:即插入新元素后每个元素的值小于其左右孩子的值。
这里要用到一个 swim 的操作,翻译过来叫 “上浮” ,就是对新插入的元素进行调整使其满足堆的性质。如果当前节点小于其父节点的值,则交换该节点与其父节的值,父节点设为新的当前节点。这是一个递归的过程(也可以非递归实现),直到当前节点的值大于父节点的值时不再操作,就好像将一个元素在二叉树中自底向上 “浮起” ,故此得名。
插入具体执行过程:
1)将新元素加入到数组(即我们所建的堆)的尾部;
2)对该元素进行 swim 操作
实现如下:
#交换两元素
def swap(heap,x,y):
t = heap[x]
heap[x] = heap[y]
heap[y] = t
#上浮操作
def swim(heap,x,location):
parent = int(location / 2)
if location > 1 and x < heap[parent]:
swap(heap,location,parent)
swim(heap,x,parent)
#返回堆的大小
def heapLen(heap):
return len(heap) - 1
#堆中加入新元素
def push(heap,x):
heap.append(x)
location = heapLen(heap)
swim(heap,x,location)
#一个例子
if __name__ == "__main__":
data = [5,3,2,1,4]
#保证数