大家好!上一篇文章,讲解了堆的结构是如何实现的,这篇文章就说一下:堆在平时有什么用,或者该如何去使用,创建一个堆。
堆的创建
我们给出一个数组,数组逻辑上可以看做一颗完全二叉树,但是还不是一个堆。
现在我们通过算法,把它构建成一个堆。根节点左右子树不是堆,我们怎么调整呢?
对数组建堆有两种方式:
1.使用向上调整,插入数据的思想建堆
当我们插入4,2时,我们向上调整,把它们变成一个堆,当插入4,2,7,8时,我们向上调整,让它们还是一个堆,依次类推。
代码如下:
结果如下:
这里我建的是小堆。
我们可以直接向上调整建堆,那么现在有一个问题?就是我们可不可以直接向下调整,建堆。
答案是:不可以。
原因:向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
如果直接进行向下调整,就会把左子树调整,但右子树没有调整,不是堆。
那我们该怎么办呢?
我们需要将左子树和右子树都先调整为堆。
那我们该怎么调呢?
从倒数第一个非叶子结点开始,为什么不从叶子结点是因为叶子结点既可以看成小堆,也可以看成大堆。
怎么找到倒数第一个非叶子结点?
就是最后一个结点的父亲。
现在,我就说一下调整的流程:
我们以小堆为例:
1.找到最后一个结点的父亲,然后左孩子和右孩子比较,找到小的孩子,然后和父亲比较,如果比父亲小就交换。
2.然后,我们将父亲减一下,来到7的位置,然后左孩子和右孩子比较,找到小的孩子,然后和父亲比较,如果比父亲小就交换。
3.再将父亲减一下,来到2的位置,然后左孩子和右孩子比较,找到小的孩子,然后和父亲比较,父亲小不需要交换。
4…再将父亲减一下,来到4的位置,也就是根节点的位置,然后就是整体的树进行向下调整。
这就是一个向下调整建堆的流程:
代码如下:
结果如下:
可能有人会发现,同一个数组向上建堆和向下建堆,它们的堆是不一样的。
那向上建堆和向下建堆有什么区别呢?下面我们来看看:
两种方式建堆的区别
首先,我们就看一下它们的时间复杂度:
因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果):
向上调整建堆:
向上调整肯定从第二层开始,因为第一层不需要调。
按最坏情况来看:
第二层插入的2个数都需要向上调整1次。
第三层插入的4个数都需要向上调整2次。
…
第h-1层插入的2^(h-2)个数都需要向上调整h-2次。
第h层插入的2^(h-1)个数都需要向上调整h-1次。
所以:
这里,我们需要借助数学里的错误相减来算结果:
结果为:
根据二叉树的一个结论:
就可以把上面的公式替换,结果为:
这就是向上调整建堆的次数和总数据的关系,根据大O的渐进表示法来看就为:O(N*logN)
向下调整建堆:
向下调整肯定从倒数第二层开始,因为倒数第一层不需要调。
按最坏情况来看:
倒数第二层的数都需要向下调整1次。
倒数第三层的数都需要向下调整2次。
…
倒数第h-1层的数都需要向下调整h-1次。
所以:
推导过程如下:
根据大O的渐进表示法来看就为:O(N)。
堆排序
堆排序即利用堆的思想来进行排序,总共分为两个步骤:
建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序。
那么有一个问题:升序能不能建小堆。
答案是:不可以。
原因:最小的数已经在第一个位置了,剩下的关系全部乱了,需要重新建堆,建堆最少要O(N),再选出次小的,不断建堆选数,最后时间复杂度为O(N^2)。所以,升序建大堆。
看下面的代码运行结果:
我们建的是大堆,然后要利用堆删除的思想来排序:
1.交换第一个数据和最后一个数据
2.然后最后一个数据不看作堆里面的
然后再向下调整,找到次大的数,再交换,依次下去。
运行结果如下:
这样升序就完了,它的时间复杂度就为O(N*logN)。
那么降序-建小堆只需要将符合换一下就好了,排序的思路都一样:
TOP-K问题
TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
讲白了就是:N个数中找出最大/最小的前K个
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
那么这个问题我们该如何解决呢?
上面的两个方法都是有一定的缺陷:
如果数据量非常大,就不太可取了(可能数据都不能一下子全部加载到内存中)。
最优方法如下:
我们就来测试一下,找出最大的10个数:
运行结果如下:
这个时间复杂度和空间复杂度为:
好了,到这里堆排序就说完了,如果前面的基础不好,理解会有困难,大家一起加油!如果大家觉得有帮助,可以多多支持,谢谢大家!