数据结构与算法学习十八:堆排序

前言

一、堆排序基本介绍

  1. 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。

  2. 堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为 大顶堆, 注意 : 没有要求结点的左孩子的值和右孩子的值的大小关系。

  3. 每个结点的值都小于或等于其左右孩子结点的值,称为 小顶堆

  4. 大顶堆举例说明
    在这里插入图片描述
    我们对堆中的结点按层进行编号,映射到数组中就是下面这个样子: (这里其实就是顺序储存二叉树
    在这里插入图片描述
    大顶堆特点:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2] // i 对应第几个节点,i从0开始编号

  5. 小顶堆举例说明
    在这里插入图片描述
    小顶堆特点:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2] // i 对应第几个节点,i从0开始编号

  6. 一般从下往上: 升序采用大顶堆,降序采用小顶堆

二、堆排序基本思想

  • 堆排序的基本思想是:
  1. 将待排序序列构造成一个 大顶堆
  2. 此时,整个序列的 最大值就是堆顶的根节点
  3. 将其与末尾元素进行交换,此时末尾就为最大值。
  4. 然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了。
  • 可以看到在构建大顶堆的过程中,元素的个数逐渐减少,最后就得到一个有序序列了.

三、思路图解

要求:给你一个数组 {4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。

3.1 步骤一 构造初始大顶堆。

将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

  1. .假设给定无序序列结构如下
    在这里插入图片描述
  2. .此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。
    在这里插入图片描述
  3. .找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。
    在这里插入图片描述
  4. 这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。
    在这里插入图片描述

此时,我们就将一个无序序列构造成了一个大顶堆。

3.2 步骤二 将堆顶元素与末尾元素进行交换

将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

  1. .将堆顶元素9和末尾元素4进行交换
    在这里插入图片描述
  2. .重新调整结构,使其继续满足堆定义
    在这里插入图片描述
  3. .再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.
    在这里插入图片描述
  4. 后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序
    在这里插入图片描述

3.3 再简单总结下堆排序的基本思路

  1. 将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
  2. 将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
  3. 重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。

四、堆排序代码实现

要求:给你一个数组 {4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。
代码实现:
说明:

  1. 堆排序不是很好理解,通过Debug 帮助大家理解堆排序
  2. 堆排序的速度非常快,在我的机器上 8百万数据 3 秒左右。O(nlogn)

4.1 代码实现

package com.feng.ch12_tree;

import java.text.SimpleDateFormat;
import java.util.Arrays;
import java.util.Date;

/*
 * 堆排序
 * 堆 是具有以下性质的  完全二叉树:
 * 1、每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆(注意 : 没有要求结点的左孩子的值和右孩子的值的大小关系。)
 * 2、每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆
 *
 * 完全二叉树:
 * 如果该二叉树的所有叶子节点都在最后一层或者倒数第二层,而且最后一层的叶子节点在左边连续,倒数第二层的叶子节点在右边连续,我们称为完全二叉树。
 *
 * 对排序分为三步:
 * 1、将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
 * 2、将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
 * 3、重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
 * 说明:
 * 第一步直接将二叉树对应的数组 调整成 大顶堆或者 小顶堆
 * 然后对第二步、第三步进行循环操作即可。
 * */
public class T4_HeapSort {

    public static void main(String[] args) {
        // 默认升序排序
//        int[] array = {4, 6, 8, 5, 9};
        int[] array = {4, 6, 8, 5, 9, -1, 90, 89, 56, -999};

        System.out.println("原始数组:");
        System.out.println(Arrays.toString(array));

        heapSort(array);

        System.out.println("测试堆排序速度:");
        testTime();  // 8000数据:88ms; 8万数据: 122ms; 80万数据:380ms; 800万数据:4s
    }

    /*
     * 测试一下 堆排序的速度, 给 80000 个数据,测试一下
     * */
    public static void testTime() {
        // 创建一个 80000个的随机的数组
        int array2[] = new int[8000000];
        for (int i = 0; i < 8000000; i++) {
            array2[i] = (int) (Math.random() * 8000000); // 生成一个[ 0, 8000000] 数
        }
//        System.out.println(Arrays.toString(array2)); // 不在打印,耗费时间太长


        long start = System.currentTimeMillis();  //返回以毫秒为单位的当前时间
        System.out.println("long start:" + start);
        Date date = new Date(start); // 上面的也可以不要,但是我想测试
        System.out.println("date:" + date);
        SimpleDateFormat format = new SimpleDateFormat("yyyy-mm-dd HH:mm:ss");
        System.out.println("排序前的时间是=" + format.format(date));

        heapSort(array2);

        System.out.println();
        long end = System.currentTimeMillis();
        Date date2 = new Date(end); // 上面的也可以不要,但是我想测试
        System.out.println("排序后的时间是=" + format.format(date2));
        System.out.println("共耗时" + (end - start) + "毫秒");
        System.out.println("毫秒转成秒为:" + ((end - start) / 1000) + "秒");
    }


    /*
     * 编写一个堆排序的方法
     * 核心:将树排成 大顶堆或者小顶堆。
     * 1、将一个数组(对应二叉树), 调整成一个大顶堆
     * 2、将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
     * 3、重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
     * 循环 2、3 步
     * */
    public static void heapSort(int[] array) {
        int temp = 0;
        //分步调整
//        System.out.println("调整成大顶堆:");
//        adjustHeap(array, 1, array.length);
//        System.out.println("第 1 次:"+Arrays.toString(array));  // [4, 9, 8, 5, 6]
//
//        adjustHeap(array, 0, array.length);
//        System.out.println("第 2 次:"+Arrays.toString(array));  // [9, 6, 8, 5, 4]

        /*
         * 完成我们最终代码 , 对上面的 两步规律 进行整合,使用for 循环,使用 array.length / 2 - 1 找到第一个非叶子结点。
         * i = array.length / 2 - 1 : 从左到右,从下到上的第一个非叶子节点的 索引
         * */
        for (int i = array.length / 2 - 1; i >= 0; i--) {
            adjustHeap(array, i, array.length);
        }
//        System.out.println("调整成的大顶堆:"+Arrays.toString(array));  // [9, 6, 8, 5, 4]

        /*
         * 2).将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
         * 3).重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。
         * */
        for (int j = array.length - 1; j > 0; j--) {
            // 交换: 将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
            temp = array[j];
            array[j] = array[0];
            array[0] = temp;
            // 每互换一次,都要对根结点 进行调整为大顶堆。
            adjustHeap(array, 0, j);
        }
//        System.out.println("排序后:"+Arrays.toString(array));  // [9, 6, 8, 5, 4]
    }




    /*
     * 将一个数组(对应二叉树), 调整成一个大顶堆
     * 功能: 完成将 以 i 对应的非叶子结点的树,调整成大顶堆
     * 举例: int[] array = {4, 6, 8, 5, 9}; => i = 1 => adjustHeap => {4, 9, 8, 5, 6}
     * 再次调用adjustHeap 传入的是   i = 0 => {9, 4, 8, 5, 6}
     * 再次调用adjustHeap 传入的是   i = 0 => {9, 4, 8, 5, 6} 进行调整 => {9, 6, 8, 5, 4}
     *
     * @param array 待调整的数组
     * @param i 表示 非叶子节点 的在数组中的索引,就是当前结点
     * @param length 表示对多少个元素进行调整,length是在逐渐减少
     * */
    public static void adjustHeap(int[] array, int i, int length) {

        int temp = array[i]; // 先取出 当前 i结点 的值,保存在临时变量
        /*
         * 开始调整
         * 1、k = i * 2 + 1: k 是以 i 为非叶子结点的 左子结点
         * */
        for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
            if (k + 1 < length && array[k] < array[k + 1]) { // 说明左子结点  小于 右子结点的值
                k++; // 让 k 指向 右子结点,这时  k 为最大值的索引
            }
            if (array[k] > temp) { // 如果右(左)子结点 大于 父结点,说明这里要对右(左)子结点(k)和父结点(i)进行 互换
                array[i] = array[k]; // 把较大的值赋给当前结点
                array[k] = temp;
                i = k; // !!! i指向 k ,改变父结点 ,继续循环比较
            } else {
                break; //!!! 敢break 是因为 这里的i 是从左到右,从下到上,第一个的非叶子节点
            }
        }

        /*
         * 老师是写在这儿,我写在了上面的判断中 :array[k] = temp;
         * 当代码走到这儿,for循环结束后,已经将以 i 为父结点的树的最大值,放在了最顶(局部)
         * */
//        array[i] = temp;// 将 temp 值 放到调整后的位置。
    }
}

4.2 测试结果

在这里插入图片描述

800万数据 仅用 4S ,可见速度之快。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
逻辑结构:描述数据元素之间的逻辑关系,如线性结构(如数组、链表)、树形结构(如二叉树、B树)、图结构(有向图、无向图等)以及集合和队列等抽象数据类型。 存储结构(物理结构):描述数据在计算机中如何具体存储。例如,数组的连续存储,链表的动态分配节点,树和图的邻接矩阵或邻接表表示等。 基本操作:针对每种数据结构,定义了一系列基本的操作,包括但不限于插入、删除、查找、更新、遍历等,并分析这些操作的时间复杂度和空间复杂度。 算法算法设计:研究如何将解决问题的步骤形式化为一系列指令,使得计算机可以执行以求解问题。 算法特性:包括输入、输出、有穷性、确定性和可行性。即一个有效的算法必须能在有限步骤内结束,并且对于给定的输入产生唯一的确定输出。 算法分类:排序算法(如冒泡排序、快速排序、归并排序),查找算法(如顺序查找、二分查找、哈希查找),图论算法(如Dijkstra最短路径算法、Floyd-Warshall算法、Prim最小生成树算法),动态规划,贪心算法,回溯法,分支限界法等。 算法分析:通过数学方法分析算法的时间复杂度(运行时间随数据规模增长的速度)和空间复杂度(所需内存大小)来评估其效率。 学习算法数据结构不仅有助于理解程序的内部工作原理,更能帮助开发人员编写出高效、稳定和易于维护的软件系统。
算法数据结构涵盖了以下主要内容: 数据结构(Data Structures): 逻辑结构:描述数据元素之间的逻辑关系,如线性结构(如数组、链表)、树形结构(如二叉树、B树)、图结构(有向图、无向图等)以及集合和队列等抽象数据类型。 存储结构(物理结构):描述数据在计算机中如何具体存储。例如,数组的连续存储,链表的动态分配节点,树和图的邻接矩阵或邻接表表示等。 基本操作:针对每种数据结构,定义了一系列基本的操作,包括但不限于插入、删除、查找、更新、遍历等,并分析这些操作的时间复杂度和空间复杂度。 算法算法设计:研究如何将解决问题的步骤形式化为一系列指令,使得计算机可以执行以求解问题。 算法特性:包括输入、输出、有穷性、确定性和可行性。即一个有效的算法必须能在有限步骤内结束,并且对于给定的输入产生唯一的确定输出。 算法分类:排序算法(如冒泡排序、快速排序、归并排序),查找算法(如顺序查找、二分查找、哈希查找),图论算法(如Dijkstra最短路径算法、Floyd-Warshall算法、Prim最小生成树算法),动态规划,贪心算法,回溯法,分支限界法等。 算法分析:通过数学方法分析算法的时间复杂度(运行时间随数据规模增长的速度)和空间复杂度(所需内存大小)来评估其效率。 学习算法数据结构不仅有助于理解程序的内部工作原理,更能帮助开发人员编写出高效、稳定和易于维护的软件系统。
逻辑结构:描述数据元素之间的逻辑关系,如线性结构(如数组、链表)、树形结构(如二叉树、B树)、图结构(有向图、无向图等)以及集合和队列等抽象数据类型。 存储结构(物理结构):描述数据在计算机中如何具体存储。例如,数组的连续存储,链表的动态分配节点,树和图的邻接矩阵或邻接表表示等。 基本操作:针对每种数据结构,定义了一系列基本的操作,包括但不限于插入、删除、查找、更新、遍历等,并分析这些操作的时间复杂度和空间复杂度。 算法算法设计:研究如何将解决问题的步骤形式化为一系列指令,使得计算机可以执行以求解问题。 算法特性:包括输入、输出、有穷性、确定性和可行性。即一个有效的算法必须能在有限步骤内结束,并且对于给定的输入产生唯一的确定输出。 算法分类:排序算法(如冒泡排序、快速排序、归并排序),查找算法(如顺序查找、二分查找、哈希查找),图论算法(如Dijkstra最短路径算法、Floyd-Warshall算法、Prim最小生成树算法),动态规划,贪心算法,回溯法,分支限界法等。 算法分析:通过数学方法分析算法的时间复杂度(运行时间随数据规模增长的速度)和空间复杂度(所需内存大小)来评估其效率。 学习算法数据结构不仅有助于理解程序的内部工作原理,更能帮助开发人员编写出高效、稳定和易于维护的软件系统。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

java冯坚持

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值