堆排序是一种树形选择排序,是对直接选择排序的有效改进。
堆是一种数据结构,其定义:任何一个非叶结点的值,都不大于(或不小于)其左右孩子结点的值。若父亲大孩子小,则这样的堆叫做大顶堆;若父亲小孩子大,则这样的堆叫做小顶堆。顾名思义,大顶堆的根结点的值是最大的,小顶堆的根结点的值是最小的。
基本思想
首先,将一个无序序列调整为大顶堆(小顶堆),我们就找到了这个无序序列的最大(或最小)值,然后将这个值交换到序列的最后(或最前)位置,这样有序序列元素就增加1个,无序序列元素减少1个,接着对这样的无序序列重复进行上述的操作,直到交换最后两个元素完成为止,我们就能得到最终的n个结点的有序序列。
代码
private void HeapSort(int[] a){
int len = a.length;
for (int j = 0; j < len; j++) {
buildMaxHeap(a, len - j - 1);
swap(a, 0, len - j - 1);
}
}
private void buildMaxHeap(int[] a, int lastIndex) {
/*
* 从索引为lastIndex的结点(最后一个结点)的父结点开始
*/
for (int i = (lastIndex + 1) / 2; i >= 0; i--) {
int j = 2 * i;//j指向索引为i的结点的左孩子结点
int temp = a[i];//暂时存储需要进行调整的结点
/*
* 当前索引为i的结点有孩子结点
*/
while (j <= lastIndex) {
/*
* 如果索引为i的结点有孩子,则j指向孩子结点中值最大的结点
*/
if (j < lastIndex && a[j] < a[j + 1])
j++;
/*
*i指向的结点的值小于j指向的孩子结点的值,则交换两者
*同时让i指向较大孩子结点,继续向下调整
*否则此趟遍历结束,i所指向的位置就是需要调整结点的位置
*/
if (temp < a[j]) {
a[i] = a[j];
i = j;
j = 2 * i;
} else
break;
}
/*
* 不需要进行调整后,让进行调整的结点回归到正确的位置(即i所指向的索引位置)
*/
a[i] = temp;
}
}
private void swap(int[] a, int i, int j) {
int temp = a[i];
a[i] = a[j];
a[j] = temp;
}
性能分析
- 时间复杂度
堆排序的最坏时间复杂度为O(nlog2n)。堆排序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多,所以堆排序不适宜记录数较少的文件。 - 空间复杂度
堆排序的空间复杂度为O(1)。 - 稳定性
堆排序是一种不稳定的排序算法。 - 堆排序优于简单选择排序的原因
直接选择排序要执行n−1趟(i=0,1,…,n-2),第i趟要从n−i个元素中选出一个具有最小排序码的元素,需要进行n−i−1次排序码比较。当n比较大时,排序码比较次数相当多。这是因为在后一趟比较选择时,往往把前一趟已做过的比较又重复做了一遍,没有把前一趟比较的结果保留下来。而堆排序可以通过树形结构保存部分比较结果,可减少比较次数。