排序算法之堆排序

原创于 2015-07-18 10:02:48 发布 · 1.3k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#排序算法 #堆排序

数据结构与算法专栏收录该内容

11 篇文章

订阅专栏

堆排序是一种基于树形选择的排序算法，通过建立大顶堆或小顶堆来找到序列中的最大或最小值。算法首先将无序序列调整为堆，然后将最大值（或最小值）交换到序列末尾，反复此过程实现排序。其时间复杂度为O(nlog2n)，空间复杂度为O(1)，但由于非稳定性，不适合对稳定性要求高的场景。堆排序相比直接选择排序的优势在于减少了不必要的比较次数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

堆排序是一种树形选择排序，是对直接选择排序的有效改进。
堆是一种数据结构，其定义：任何一个非叶结点的值，都不大于（或不小于）其左右孩子结点的值。若父亲大孩子小，则这样的堆叫做大顶堆；若父亲小孩子大，则这样的堆叫做小顶堆。顾名思义，大顶堆的根结点的值是最大的，小顶堆的根结点的值是最小的。

基本思想

首先，将一个无序序列调整为大顶堆（小顶堆），我们就找到了这个无序序列的最大（或最小）值，然后将这个值交换到序列的最后（或最前）位置，这样有序序列元素就增加1个，无序序列元素减少1个，接着对这样的无序序列重复进行上述的操作，直到交换最后两个元素完成为止，我们就能得到最终的n个结点的有序序列。

代码

private void HeapSort(int[] a){
    int len = a.length;
    for (int j = 0; j < len; j++) {
        buildMaxHeap(a, len - j - 1);
        swap(a, 0, len - j - 1);
    }
}

private void buildMaxHeap(int[] a, int lastIndex) {
    /*
     * 从索引为lastIndex的结点（最后一个结点）的父结点开始
     */
    for (int i = (lastIndex + 1) / 2; i >= 0; i--) {
        int j = 2 * i;//j指向索引为i的结点的左孩子结点
        int temp = a[i];//暂时存储需要进行调整的结点
        /*
         * 当前索引为i的结点有孩子结点
         */
        while (j <= lastIndex) {
            /*
             * 如果索引为i的结点有孩子，则j指向孩子结点中值最大的结点
             */
            if (j < lastIndex && a[j] < a[j + 1])
                j++;
            /*
             *i指向的结点的值小于j指向的孩子结点的值，则交换两者
             *同时让i指向较大孩子结点，继续向下调整
             *否则此趟遍历结束，i所指向的位置就是需要调整结点的位置
             */
            if (temp < a[j]) {
                a[i] = a[j];
                i = j;
                j = 2 * i;
            } else
                break;
        }
        /*
         * 不需要进行调整后，让进行调整的结点回归到正确的位置（即i所指向的索引位置）
         */
        a[i] = temp;
    }
}

private void swap(int[] a, int i, int j) {
    int temp = a[i];
    a[i] = a[j];
    a[j] = temp;
}

性能分析

时间复杂度
堆排序的最坏时间复杂度为 $O(nlog_2n)$ 。堆排序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多，所以堆排序不适宜记录数较少的文件。
空间复杂度
堆排序的空间复杂度为 $O(1)$ 。
稳定性
堆排序是一种不稳定的排序算法。
堆排序优于简单选择排序的原因
直接选择排序要执行 $n-1$ 趟（i=0，1，…,n-2），第i趟要从 $n-i$ 个元素中选出一个具有最小排序码的元素，需要进行 $n-i-1$ 次排序码比较。当n比较大时，排序码比较次数相当多。这是因为在后一趟比较选择时，往往把前一趟已做过的比较又重复做了一遍，没有把前一趟比较的结果保留下来。而堆排序可以通过树形结构保存部分比较结果，可减少比较次数。