堆的创建和堆排序

学代码的咸鱼

已于 2022-09-16 09:50:39 修改

阅读量1.8k

点赞数 5

分类专栏：数据结构文章标签：数据结构

于 2022-05-13 20:01:31 首次发布

本文链接：https://blog.csdn.net/qq_52154068/article/details/124197895

版权

数据结构专栏收录该内容

16 篇文章 2 订阅

订阅专栏

大家好！上一篇文章，讲解了堆的结构是如何实现的，这篇文章就说一下：堆在平时有什么用，或者该如何去使用，创建一个堆。
在这里插入图片描述

文章目录

堆的创建
- 两种方式建堆的区别
堆排序
- TOP-K问题

堆的创建

在这里插入图片描述
我们给出一个数组，数组逻辑上可以看做一颗完全二叉树，但是还不是一个堆。

现在我们通过算法，把它构建成一个堆。根节点左右子树不是堆，我们怎么调整呢？
对数组建堆有两种方式：
1.使用向上调整，插入数据的思想建堆
当我们插入4，2时，我们向上调整，把它们变成一个堆，当插入4，2，7，8时，我们向上调整，让它们还是一个堆，依次类推。

代码如下：
在这里插入图片描述
结果如下：

这里我建的是小堆。

我们可以直接向上调整建堆，那么现在有一个问题？就是我们可不可以直接向下调整，建堆。
答案是：不可以。
原因：向下调整算法有一个前提：左右子树必须是一个堆，才能调整。
在这里插入图片描述
如果直接进行向下调整，就会把左子树调整，但右子树没有调整，不是堆。

那我们该怎么办呢？
我们需要将左子树和右子树都先调整为堆。

那我们该怎么调呢？
从倒数第一个非叶子结点开始，为什么不从叶子结点是因为叶子结点既可以看成小堆，也可以看成大堆。

怎么找到倒数第一个非叶子结点？
就是最后一个结点的父亲。

现在，我就说一下调整的流程：
我们以小堆为例：
1.找到最后一个结点的父亲，然后左孩子和右孩子比较，找到小的孩子，然后和父亲比较，如果比父亲小就交换。
在这里插入图片描述

2.然后，我们将父亲减一下，来到7的位置，然后左孩子和右孩子比较，找到小的孩子，然后和父亲比较，如果比父亲小就交换。

3.再将父亲减一下，来到2的位置，然后左孩子和右孩子比较，找到小的孩子，然后和父亲比较，父亲小不需要交换。
在这里插入图片描述
4…再将父亲减一下，来到4的位置，也就是根节点的位置，然后就是整体的树进行向下调整。

这就是一个向下调整建堆的流程：

代码如下：

结果如下：

可能有人会发现，同一个数组向上建堆和向下建堆，它们的堆是不一样的。
那向上建堆和向下建堆有什么区别呢？下面我们来看看：

两种方式建堆的区别

首先，我们就看一下它们的时间复杂度：
因为堆是完全二叉树，而满二叉树也是完全二叉树，此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值，多几个节点不影响最终结果)：
在这里插入图片描述
向上调整建堆：
向上调整肯定从第二层开始，因为第一层不需要调。
按最坏情况来看：
第二层插入的2个数都需要向上调整1次。
第三层插入的4个数都需要向上调整2次。
…
第h-1层插入的2^(h-2)个数都需要向上调整h-2次。
第h层插入的2^(h-1)个数都需要向上调整h-1次。
所以：
在这里插入图片描述
这里，我们需要借助数学里的错误相减来算结果：

结果为：

根据二叉树的一个结论：

就可以把上面的公式替换，结果为：

这就是向上调整建堆的次数和总数据的关系，根据大O的渐进表示法来看就为：O(N*logN)

向下调整建堆：
在这里插入图片描述
向下调整肯定从倒数第二层开始，因为倒数第一层不需要调。
按最坏情况来看：
倒数第二层的数都需要向下调整1次。
倒数第三层的数都需要向下调整2次。
…
倒数第h-1层的数都需要向下调整h-1次。
所以：
在这里插入图片描述
推导过程如下：

根据大O的渐进表示法来看就为：O(N)。

堆排序

堆排序即利用堆的思想来进行排序，总共分为两个步骤：
在这里插入图片描述
建堆和堆删除中都用到了向下调整，因此掌握了向下调整，就可以完成堆排序。
那么有一个问题：升序能不能建小堆。

答案是：不可以。
原因：最小的数已经在第一个位置了，剩下的关系全部乱了，需要重新建堆，建堆最少要O(N)，再选出次小的，不断建堆选数，最后时间复杂度为O(N^2)。所以，升序建大堆。

看下面的代码运行结果：
在这里插入图片描述
我们建的是大堆，然后要利用堆删除的思想来排序：
1.交换第一个数据和最后一个数据
2.然后最后一个数据不看作堆里面的

然后再向下调整，找到次大的数，再交换，依次下去。

运行结果如下：

这样升序就完了，它的时间复杂度就为O(N*logN)。

那么降序-建小堆只需要将符合换一下就好了，排序的思路都一样：
在这里插入图片描述

TOP-K问题

TOP-K问题：即求数据结合中前K个最大的元素或者最小的元素，一般情况下数据量都比较大。
讲白了就是：N个数中找出最大/最小的前K个
比如：专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

那么这个问题我们该如何解决呢？
在这里插入图片描述
上面的两个方法都是有一定的缺陷：
如果数据量非常大，就不太可取了(可能数据都不能一下子全部加载到内存中)。
最优方法如下：

我们就来测试一下，找出最大的10个数：

运行结果如下：

这个时间复杂度和空间复杂度为：
在这里插入图片描述
好了，到这里堆排序就说完了，如果前面的基础不好，理解会有困难，大家一起加油！如果大家觉得有帮助，可以多多支持，谢谢大家！