堆的应用（堆排序、TOP - K问题）

Yawesh

已于 2023-05-30 14:24:24 修改

阅读量1.2k

点赞数 67

分类专栏：数据结构文章标签：开发语言数据结构 c++ 算法排序算法

于 2023-05-30 14:17:00 首次发布

本文链接：https://blog.csdn.net/m0_75215937/article/details/130946023

版权

数据结构专栏收录该内容

21 篇文章 9 订阅

订阅专栏

文章详细介绍了堆排序的过程，包括建堆、交换和堆化，并提供了相关代码实现。同时，文章探讨了TOP-K问题的解决策略，利用堆在大数据量下找出前K个最大或最小元素的高效方法，强调了堆在处理此类问题时的时间复杂度优势。

摘要由CSDN通过智能技术生成

前言

🍎 时间复杂度：

🥝 堆排序的最坏时间复杂度为：O(n*lg(n))

🥝 TOP - K问题的最坏时间复杂度为：O(n*lg(k))

🍁前面我们学习了二叉树、以及堆的结构，也用顺序表的结构成功的把堆的结构一步一步的敲出来了。IT公司的吉祥“树” 二叉树-（堆）C语言创建_硕硕C语言的博客-CSDN博客（里面有一些树的基础知识，没有了解过的可以看一看，顺便来个三连应该不过分吧🥰）
，下面我将带领着大家来了解一下堆有什么应用、怎么用、用这个有什么好处。

堆排序

🚩堆排序即利用堆的思想来进行排序，总共分为两个步骤：

1. 建堆

🔴升序：建大堆
🔴降序：建小堆

2. 利用堆删除思想来进行排序

💧 建堆和堆删除中都用到了向下调整，因此掌握了向下调整，就可以完成堆排序。

思路：

⭕1.首先将待排序的数组构造成一个大根堆，此时，整个数组的最大值就是堆结构的顶端

⭕2.将顶端的数与末尾的数交换，此时，末尾的数为最大值，剩余待排序数组个数为n-1

⭕3.将剩余的n-1个数再构造成大根堆，再将顶端数与n-1位置的数交换，如此反复执行，便能得到有序数组

最详细的堆排序---排序算法，思路清晰动图讲解，五分钟搞懂！_Steve_hanhaiLong的博客-CSDN博客_堆排序

python-列表排序_QFIUNE的博客-CSDN博客_python列表排序

3. 代码：

    //堆排序
    public static void heapSort(int[] arr) {
        //构造大根堆
        heapInsert(arr);
        int size = arr.length;
        while (size > 1) {
            //固定最大值
            swap(arr, 0, size - 1);
            size--;
            //构造大根堆
            heapify(arr, 0, size);
 
        }
 
    }
 
    //构造大根堆（通过新插入的数上升）
    public static void heapInsert(int[] arr) {
        for (int i = 0; i < arr.length; i++) {
            //当前插入的索引
            int currentIndex = i;
            //父结点索引
            int fatherIndex = (currentIndex - 1) / 2;
            //如果当前插入的值大于其父结点的值,则交换值，并且将索引指向父结点
            //然后继续和上面的父结点值比较，直到不大于父结点，则退出循环
            while (arr[currentIndex] > arr[fatherIndex]) {
                //交换当前结点与父结点的值
                swap(arr, currentIndex, fatherIndex);
                //将当前索引指向父索引
                currentIndex = fatherIndex;
                //重新计算当前索引的父索引
                fatherIndex = (currentIndex - 1) / 2;
            }
        }
    }
    //将剩余的数构造成大根堆（通过顶端的数下降）
    public static void heapify(int[] arr, int index, int size) {
        int left = 2 * index + 1;
        int right = 2 * index + 2;
        while (left < size) {
            int largestIndex;
            //判断孩子中较大的值的索引（要确保右孩子在size范围之内）
            if (arr[left] < arr[right] && right < size) {
                largestIndex = right;
            } else {
                largestIndex = left;
            }
            //比较父结点的值与孩子中较大的值，并确定最大值的索引
            if (arr[index] > arr[largestIndex]) {
                largestIndex = index;
            }
            //如果父结点索引是最大值的索引，那已经是大根堆了，则退出循环
            if (index == largestIndex) {
                break;
            }
            //父结点不是最大值，与孩子中较大的值交换
            swap(arr, largestIndex, index);
            //将索引指向孩子中较大的值的索引
            index = largestIndex;
            //重新计算交换之后的孩子的索引
            left = 2 * index + 1;
            right = 2 * index + 2;
        }
 
    }
    //交换数组中两个元素的值
    public static void swap(int[] arr, int i, int j) {
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;
    }

TOP - K问题

🍪TOP-K问题：即求数据结合中前K个最大的元素或者最小的元素，一般情况下数据量都比较大。比如：专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。对于Top-K问题，能想到的最简单直接的方式就是排序，但是：如果数据量非常大，排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决，基本思路如下：