排序算法之堆排序

堆排序

前言

堆排序快速排序归并排序的平均时间复杂度都为,由于堆排序对原始记录的排序状态并不敏感,因此无论是最好、最坏和平均时间复杂度均为。这在性能上显然要远远好于冒泡排序、简单选择排序、直接插入排序的的时间复杂度了。

空间复杂度上,它只有一个用来交换的暂存单元,也非常不错。不过由于记录的比较与交换是跳跃式进行,因此堆排序是一种不稳定的排序算法

此外,由于初始构建堆所需的比较次数较多,因此,它并不适合待排序序列个数较少的情况。

 

二叉堆

     二叉堆是具有下列性质的完全二叉树

(1)    二叉堆的父节点的值总是大于或等于(小于或等于)其左右孩子的值;

(2)    每个节点的左右子树都是这样的一棵二叉堆。

每个节点的值都大于或等于其左右孩子节点的值,称为大顶堆;或者每个节点的值都小于或等于其左右孩子节点的值,称为小顶堆

 

堆排序算法

       堆排序(Heap Sort)就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是:将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆顶的根节点。将它移走(其实就是讲其与堆数组的末尾元素交换,此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素中的次大值。如此反复执行,便能得到一个有序序列了

       由于输入的是一个无序数列,因此要实现堆排序,需要解决以下两个问题:

(1)    如何将一个无序序列建成一个堆(二叉堆构建

(2)    在去掉堆顶元素后,如何将剩下的元素调整为一个二叉堆(二叉堆调整

针对第一个问题,可能很明显会想到利用堆的插入操作,一个一个的插入元素,每次插入后调整元素的位置,使得新的序列依然为二叉堆。这种操作一般是自底向上的调整操作,即先将待插入元素放在二叉堆后面,而后逐渐向上将其与父节点比较,进而调整位置。但根据二叉堆的特点,完全用不着这么做,我们只需先解决第二个问题,自然第一个问题也就迎刃而解了。

 

二叉堆调整

假设我们排序的目标是从小到大,因此我们使用大顶堆;我们将二叉堆中的元素以程序遍历后的顺序保存在一维数组中,根节点在数组中的位置序号为0。

这样,如果某个节点的位置序号为i,那么它的左右孩子的位置序号分别为2i+1和2i+2。

为了使调整过程更容易理解,我们采用如下的二叉堆来分析:


       这里数组A中的元素个数为8,很明显最大值为A0,为了实现排序后的元素按照从小到大的顺序排列,我们可以将二叉堆中的最后一个元素A7与A0交换,这样A7中保存的就是数组中的最大值,而此时二叉堆变成如下情况:


       为了将其调整为二叉堆,我们需要寻找4应该插入的位置。为此,我们让4与它的孩子节点中的最大的那个,也就是其左孩子7,进行比较,由于4<7,将4与7交换,这样二叉树变成如下的形式:


       接下来,继续让4与其左右孩子节点中的最大者,即6,进行比较,同样由于4<6,交换4与6,这样二叉树变成如下形式:


       这样便又构成二叉堆,这时A0为7,是所有元素中的最大值。同样,我们将二叉堆中的最后一个元素A6与A0交换,这样A6中保存的就是数组中第二大元素6,而A0就变成了3,如下图所示:


       为了将其调整成为二叉堆,将3与其左右孩子中的最大者即6进行比较,由于3<6,因此将3与6交换,继续比较交换后的二叉树中3和其左右孩子中的最大者4,得到以下二叉堆:


       同样将A0与此时堆中的最后一个元素A5交换,同样A5保存的就是数组中第三大元素,再次调整剩余的节点,如此反复,直到堆中仅剩最后一个元素,这时整个数组便已按照从小到大的顺序排列好了。


代码:

/*******************
 *    Heap Sort
 *
 * Date: 2017/0624
 *
 * ****************/

#include 
   
   
    
    
using namespace std;

/*
 *
 * arr[start+1...end]满足最大堆定义,
 * 将arr[start]加入到最大堆arr[start+1...end]中,
 * 调整arr[start]的位置,使arr[start...end]也成为最大堆。
 * 注:由于数组从0开始计算序号,也就是二叉堆的根节点序号为0,
 * 因此序号为i的节点的左右孩子节点序号分别为2i+1, 2i+2
 *
*/

void HeapAdjustDown(int* arr, int start, int end){
    int temp = arr[start];
    int i = 2*start + 1;
    while(i <= end){
        //找出左右孩子节点中最大的那个
        if(i + 1 <= end && arr[i] < arr[i+1])
            i++;
        //符合堆的定义,则不用调整
        if(arr[i] < temp)
            break;
        arr[start] = arr[i];
        start = i;
        i = 2*start + 1;
    }
    arr[start] = temp;
}

//堆排序后的顺序为从小到大,因此建立大顶堆

void HeapSort(int* arr, int len){
    int i;
    //把数组建成大顶堆
    //第一个非叶子结点的位置序号为len/2-1
    for(i=len/2-1; i>=0; i--)
        HeapAdjustDown(arr, i, len-1);

    //进行堆排序
    for(i=len-1; i>0; i--){
        //堆顶元素和最后一个元素交换
        //这样最后一个元素保存的是最大数
        //每次循环依次将次大的数放在其前面的位置
        //这样得到的顺序就是从小到大

        int temp = arr[i];
        arr[i] = arr[0];
        arr[0] = temp;

        //将arr[0...i-1]重新调整为大顶堆
        HeapAdjustDown(arr, 0, i-1);
    }
}

int main(){

    int a[] = {1, 7, 8, 9, 3, 4, 2, 6, 5, 0};
    cout << "Original array: ";
    for(int i=0; i<10; i++)
        cout << a[i] << " ";
    cout << endl;

    HeapSort(a, 10);
    cout << "HeapSorted array: ";
    for(int i=0; i<10; i++)
        cout << a[i] << " ";
    cout << endl;

    return 0;
}

   
   

运行结果:


总结

       复杂度:我们在重新调整堆时,都要将父节点与孩子节点进行比较,这样,每次重新调整堆的时间复杂度变为,而堆排序有n-1次重新调整堆的操作,建堆时有((len-1)/2+1)次重新调整堆的操作,因此堆排序的平均时间复杂度为。由于我们这里没有借助辅助存储空间,因此空间复杂度为。

       堆排序在排序元素较少时有点大材小用,待排序元素较多时,堆排序还是很有效的。另外,堆排序在最坏情况下,时间复杂度也为。相对于快速排序(平均复杂度),最坏情况下,这是堆排序最大的优点。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值