1.堆
(二叉)堆数据结构是一种数组对象,可以被视为一颗完全二叉树。表示堆的数组A是一个具有两个属性的对象:length[A]是数组中元素个数,heap-size[A]是存放在A中的堆的元素个数,heap-size[A]<=length[A]。树的根表示为A[1],给定某结点下标i,其父节点PARENT(i) = i/2(向下取整),LEFT[i] = 2i,RIGHT[i] = 2i+1。
2.保持堆的性质
二叉堆有两种:最大堆和最小堆,最大堆是本文讨论的主要类型,最大堆的性质就是,堆中最大元素存放在根结点中,且,以任意一个结点为根的子树中,各结点的值都不大于该子树根结点的值。
2.1算法
MAX-HEAPIFY是对最大堆操作的重要子程序,其输入为一个数组A和下标i,当A[i]小于其子女时可能违背最大堆性质,为了保持堆的性质,调用MAX-HEAPIFY,MAX-HEAPIFY让A[i]在最大堆中“下降”,使以i为根的子树成为最大堆。具体的伪代码如下所示:
MAX_HEAPIFY(A,i)
1 l ← LEFT(i)
2 r ← RIGHT(i)
3 if l <= heap-size[A] and A[l] > A[i]
4 then largest ← l
5 else largest ← i
6 if r <= heap-size[A] and A[r] > A[largest]
7 then largest ← r
8 if largest ≠ i
9 then exchange A[i] ‹-› A[largest]
10 MAX_HEAPIFY(A,largest)
下图描述了MAX_HEAPIFY的过程:
在算法中,每一步,从元素A[i],A[LEFT(i)]和A[RIGHT(i)]中找出最大的,将下标存在largest中,如果A[i]是最大的,即i=largest,则以i为根的子树已经是最大堆,如果A[i]不是最大的,则交换A[i]与A[largest],将i“下降”,堆该子树递归调用MAX-HEAPIFY。
2.2算法分析
当MAX-HEAPIFY作用在一棵以结点i为根、大小为n的子树上时,其运行时间为调整元素A[i]、A[LEFT(i)]和A[RIGHT(i)]的关系所用时间为θ(1)的常数时间,再加上对以i的某个子节点为根的子树递归调用MAX-HEAPIFY所需的时间。i结点的子树大小至多为2n/3(最坏情况发生在底层恰好半满的时候),那么MAX-HEAPIFY的运行时间如下:
根据主定理的情况2,该递归式的解为