算法学习笔记----堆排序

  堆是一个数组,可以看成一个近似的完全二叉树,除了最底层外,其余各层都是充满的,而且是从左到右填充。假设数组A[1..A.hep_size]是一个对,给定一个结点的下标i,很容计算出其父节点、左孩子和右孩子的下标,如下所示(这里的数组下标是从1开始):


  在C语言中数组下标是从0开始的,因此在计算父节点、左右子节点时的公式和上图中有所不同,如下图所示:


  二叉堆可以分为两种形式:最大堆和最小堆。在最大堆中,除了根节点以外所有的节点i都要满足:A[PARENT(i)]A[i]。最小堆则刚好相反。下面的讨论以最大堆为例。

一、维护堆的性质

  MAX-HEAPIFY是用于维护最大堆性质的重要过程。假设根节点为LEFT(i)和RIGHT(i)的二叉树都是最大堆,但此时A[i]有可能小于其孩子,这就违背了最大堆的性质。这时为了维护最大堆的性质,将索引为i的节点和其孩子中最大的节点互换。假设i的左孩子较大,此时需要将节点i和其左孩子互换,互换后可能会导致以节点i的左孩子为根节点的最大堆违背了最大堆的性质,因此需要继续调整节点的顺序,直到根节点大于左右孩子节点或处理到叶子节点为止。以下面的最大堆(下标是从0开始)为例:


  在阴影部分的节点i=1处,A[1]违背了最大堆性质,A[1]及其左右孩子节点中最大的是节点i=3,因此将节点i=2和节点i=3互换,使节点i=2恢复最大堆性质,如下图所示:


  互换后,节点i=3的值小于其右孩子i=8的节点,因此需要将这两个节点互换,使节点i=3恢复最大堆性质,如下图所示:


  互换后,节点i=8为叶子节点,没有子节点了,也就不再有新的数据交换了。

  接下来计算 MAX-HEAPIFY的时间复杂度。每个孩子的子树的大小至多为2n/3,最坏的情况发生在树的最底层恰好半满的时候,因为最大堆是一个类似完全二叉树的数组,左右子树的高度最多相差1,所以在子树的高度较高的一边时执行的次数可能越多。

  下面证明一下,为什么每个子树的大小至多为2n/3。假设一个最大堆构成的完全二叉树的高度为h,如果完全充满的话,堆的元素个数为2^(h+1)-1 。我们在上面提到过,根节点的左右子树的高度最多相差为1,因此左右子树差距最大的情况发生在其中一个子树的最后一层充满,而另一个子树的对应的层为空。假设最大的子树为左子树,则左子树的元素个数为2^h-1,而右子树的元素个数为2^(h-1)-1,假设总的个数为n,左子树的个数为left_count, 右子树的个数为righ_count,计算左子树所占的最大比重,如下所示:


  从上面的步骤中可以看出,总的时间复杂度包括调整A[i]、A[LEFT(i)]和A[RIGHT(i)]的关系的时间代价Θ(1),加上在一颗以i的一个孩子为根节点的子树上执行维护最大堆的操作的时间代价(这里假设递归调用会发生)。因为每个孩子的子树的大小至多为2n/3,我们可以用下面的递归式来计算总的运行时间:

T(n)T(2n/3)+Θ(1)

 根据主定理(参考这里)的情况2,上述递归式的解为T(n)=O(lgn)。也就是说,对于一个树高度为h的的节点来说, MAX-HEAPIFY需要的时间复杂度为O(h)。

  下面是代码实现,分别利用递归和循环来完成。

  递归版本:

#include <stdio.h>

void exchange(int *a, int i, int j)
{
    a[i] ^= a[j];
    a[j] ^= a[i];
    a[i] ^= a[j];
}

int left_child(int
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值