堆排序C语言实现详解

最新推荐文章于 2023-10-03 16:15:24 发布

hurryddd

最新推荐文章于 2023-10-03 16:15:24 发布

阅读量2.1k

点赞数 2

分类专栏：数据结构与算法

本文链接：https://blog.csdn.net/m0_37845735/article/details/103993715

版权

数据结构与算法专栏收录该内容

21 篇文章 5 订阅

订阅专栏

一、堆

这里的堆是一种特殊的树结构，跟我们平时使用的物理内存堆没有任何关系。具有以下特点：

1、堆是一个完全二叉树。除了最后一层，其它层节点个数都是满的，最后一层的节点都靠左排列

2、堆中每一个节点的值都必须大于等于（或小于等于）其子树中每个节点的值。对于每个节点的值都大于等于其子树每个节点的值的堆被称为“大顶堆”，相反则为“小顶堆”。

二、堆实现

1、堆存储

完全二叉树比较适合用数组来存储。用数组来存储完全二叉树是非常节省存储空间的。因为我们不需要存储左右子节点的指针，单纯地通过数组的下标，就可以找到一个节点的左右子节点和父节点。

数据是从下表为1开始存储的时，数组中下标为 i 的节点，左子节点就是下标为 i∗2 的节点，右子节点就是下标为 i∗2+1 的节点，父节点就是下标为 i / 2 的节点。

2、堆操作

一个包含 n 个节点的完全二叉树，树的高度不会超过 log2n。堆化的过程是顺着节点所在路径比较交换的，所以堆化的时间复杂度跟树的高度成正比，也就是 O(logn)。插入数据和删除堆顶元素的主要逻辑就是堆化，所以，往堆中插入一个元素和删除堆顶元素的时间复杂度都是 O(logn)

1、插入新的元素

由于堆存储结构为数组，可以将新插入的元素放到堆得最后，往堆中插入一个元素后，还需要满足堆的两个特性，不满足特性的还需要进行调整，这个过程叫 堆化（heapify）

堆化实际上有两种，从下往上和从上往下。以下是从下往上的堆化方法

2、删除堆顶元素

根据堆的第二条特性可知，堆顶元素存放的必定是堆中数据的最大值或最小值。对于大顶堆来说，如果删除了堆顶元素后，堆中第二大的数据肯定在堆顶元素的左右节点中，这是我们需要将第二大的数据放至堆顶，以此类推，直到叶子节点被删除。但这种方法删除堆顶元素后，可能堆化出来的堆并不满足堆的特性了，叶子节点可能为空。

由于堆在堆化过程中只是交换了两个元素的位置，所以如果将堆顶元素删除后，将堆（数组）中的最后一个元素放至堆顶，然后利用同样的父子节点判断方法进行堆化，那么最后删除的位置肯定是最后一个节点，就不会出现“数组空洞”的现象

三、堆的应用

1、堆排序

我们可以把堆排序的过程大致分解成两个大的步骤，建堆和排序

1、建堆

方法一：从前往后处理数组数据，在堆中插入一个元素后，依次将下标为1-n的数据插入堆中并进行堆化。每插如一个节点就会进行一次堆化

方法二：从后往前处理数组数据，从第一个非叶子节点开始，依次向前堆化。对下标从 n/2 开始到 1 的数据进行堆化，下标是 n/2+1 到 n 的节点是叶子节点，我们不需要堆化。实际上，对于完全二叉树来说，下标从 n/2+1 到 n 的节点都是叶子节点。这种方法适用于对一个已有的数组进行堆化。

2、排序

建堆结束之后，数组中的数据已经是按照大顶堆的特性来组织的。数组中的第一个元素就是堆顶，也就是最大的元素。我们把它跟最后一个元素交换，那最大元素就放到了下标为 n 的位置。然后再通过堆化的方法，将剩下的 n−1 个元素重新构建成堆。堆化完成之后，我们再取堆顶的元素，放到下标是 n−1 的位置，一直重复这个过程，直到最后堆中只剩下标为 1 的一个元素，排序工作就完成了

整个堆排序的过程，都只需要极个别临时存储空间，所以堆排序是原地排序算法。堆排序包括建堆和排序两个操作，建堆过程的时间复杂度是 O(n)，排序过程的时间复杂度是 O(nlogn)，所以，堆排序整体的时间复杂度是 O(nlogn)。

堆排序不是稳定的排序算法，因为在排序的过程，存在将堆的最后一个节点跟堆顶节点互换的操作，所以就有可能改变值相同数据的原始相对顺序。

2、优先级队列

优先级队列是一种特殊的队列，优先级高的数据先出队，而不再像普通的队列那样，先进先出。实际上，堆就可以看作优先级队列，只是称谓不一样罢了。

3、求 Top K

求 Top K 问题又可以分为针对静态数据和针对动态数据，只需要利用一个堆，就可以做到非常高效率的查询 Top K 的数据。