1、介绍
堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为 O(nlogn),它也是不稳定排序。
堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆(注意 : 没有要求结点的左孩子的值和右孩子的值的大小关系)。 每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。
一般升序采用大顶堆,降序采用小顶堆。
2、算法分析
(1)将待排序序列构造成一个大顶堆,整个序列的最大值就是堆顶的根节点。
(2)再将其根节点与末尾元素进行交换,此时末尾就为最大值。
(3)然后将剩余 n-1 个元素重新构造成一个堆,这样会得到 n 个元素的次小值。如此反复执行,便能得到一个有序序列了。
数组 {4,6,8,5,9} ,数组升序排序:
步骤一:构建一个大顶堆
步骤二:将堆顶元素与末尾元素进行交换,使末尾元素最大
步骤三:然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
总结下堆排序的基本思路:
1) 将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
2) 将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
3) 重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
3、代码实现
package com.czq.algorithm.sort;
import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;
/**
* 堆排序
*
* @author czq
* @date 2020/07/31
*/
public class HeapSort {
public static void main(String[] args) {
//测试排序的执行速度
//创建要给 800000 个的随机的数组
int[] arr = new int[80000000];
for (int i = 0; i < arr.length; i++) {
// 生成一个[0, 8000000) 数
arr[i] = (int) (Math.random() * 8000000);
}
// int arr[] = {4, 6, 8, 5, 9};
System.out.println("============排序前===============");
// System.out.println("排序后:" + Arrays.toString(arr));
SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
System.out.println("排序前时间:" + sdf.format(new Date()));
heapSortAnalysis(arr);
System.out.println("============排序后===============");
System.out.println("排序前时间:" + sdf.format(new Date()));
// System.out.println("排序后:" + Arrays.toString(arr));
}
/**
* 堆排序分析方法
*
* @param arr 排序的原始数组
*/
private static void heapSortAnalysis(int[] arr) {
int temp = 0;
/*************************第1轮****************************/
adjustHeap(arr, 1, arr.length);
//第 1 轮后:[4, 9, 8, 5, 6]
System.out.println("第 1 轮后:" + Arrays.toString(arr));
/*************************第2轮****************************/
adjustHeap(arr, 0, arr.length);
//第 2 轮后:[9, 6, 8, 5, 4]
System.out.println("第 2 轮后:" + Arrays.toString(arr));
/*************************第3轮****************************/
//交换
temp = arr[arr.length - 1];
arr[arr.length - 1] = arr[0];
arr[0] = temp;
//调整
adjustHeap(arr, 0, arr.length - 1);
System.out.println("第 3 轮后:" + Arrays.toString(arr));
/*************************第4轮****************************/
//交换
temp = arr[arr.length - 2];
arr[arr.length - 2] = arr[0];
arr[0] = temp;
//调整
adjustHeap(arr, 0, arr.length - 2);
System.out.println("第 4 轮后:" + Arrays.toString(arr));
/*************************第5轮****************************/
//交换
temp = arr[arr.length - 3];
arr[arr.length - 3] = arr[0];
arr[0] = temp;
//调整
adjustHeap(arr, 0, arr.length - 3);
System.out.println("第 5 轮后:" + Arrays.toString(arr));
/*************************第6轮****************************/
//交换
temp = arr[arr.length - 4];
arr[arr.length - 4] = arr[0];
arr[0] = temp;
//调整
adjustHeap(arr, 0, arr.length - 4);
System.out.println("第 6 轮后:" + Arrays.toString(arr));
}
/**
* 堆排序
*
* @param arr 排序的原始数组
*/
private static void heapSort(int[] arr) {
int temp = 0;
// 1) 将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆
for (int i = arr.length / 2 - 1; i >= 0; i--) {
adjustHeap(arr, i, arr.length);
}
// 2) 将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
// 3) 重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
for (int j = arr.length - 1; j > 0; j--) {
temp = arr[j];
arr[j] = arr[0];
arr[0] = temp;
adjustHeap(arr, 0, j);
}
}
/**
* 功能:完成将以 i 对应的非叶子结点的二叉树调整成大顶堆
* 举例:int arr[] = {4, 6, 8, 5, 9}; => i = 1 => adjustHeap => 得到 {4, 9, 8, 5, 6}
* 再次调用 adjustHeap 传入的是 i = 0 => 得到 {4, 9, 8, 5, 6} => {9, 6, 8, 5, 4}
*
* @param arr 待调整的数组
* @param i 表示非叶子结点在数组中索引
* @param length 表示对多少个元素继续调整, length 是在逐渐的减少
*/
public static void adjustHeap(int arr[], int i, int length) {
//先取出当前元素的值,保存在临时变量
int temp = arr[i];
// k = i * 2 + 1,k 是 i 结点的左子结点
for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
//右子节点存在,且左子结点的值小于右子结点的值
if (k + 1 < length && arr[k] < arr[k + 1]) {
// k 指向右子结点
k++;
}
//如果子结点大于父结点
if (arr[k] > temp) {
//把较大的值赋给当前结点
arr[i] = arr[k];
// i 指向 k(下一个树),继续循环比较
i = k;
} else {
break;
}
}
//当 for 循环结束后,已经将以 i 为父结点的树的最大值放在了最顶(局部)
//将 temp 值放到调整后的位置
arr[i] = temp;
}
}
结果:800000长度的数组排序时间需要0-1s,时间复杂度O(nlogn),空间复杂度O(1)
8000000长度的数组排序时间需要2s左右
80000000长度的数组排序时间需要29~30s左右