深入理解堆结构：基础、应用及代码实践

本文链接：https://blog.csdn.net/lph159/article/details/138341660

堆是一种关键的数据结构，它在许多算法和系统设计中发挥着核心作用。本文深入探讨了堆的定义、内部结构、操作方式及其广泛应用，提供了实际的示例以加深理解。

堆（Heap）是一种特殊的完全二叉树，通常用数组来实现，它满足堆性质，即在这个数据结构中，每一个父节点的值都与其子节点的值保持一定的大小关系。这种特性使得堆非常适合实现优先队列，其中元素的添加和移除都能保持较高的效率。堆主要分为两类：大根堆和小根堆。

堆是一种可以迅速找到最大值或最小值的数据结构。堆通常被视为一种抽象的数据类型，可以视为一种特殊的树形结构。完全二叉树的性质保证了堆的高效性，即堆中每个节点的子树都是完全二叉树。

在深入堆的类型之前，我们首先理解什么是完全二叉树。完全二叉树是一种二叉树，其中所有的层都被完全填满，除了可能的最后一层。在最后一层，所有的节点都尽可能地向左对齐。这种结构使得堆可以有效地使用数组来存储，每个节点的子节点和父节点位置都可以通过简单的索引计算得出。

在这里插入图片描述

大根堆：在大根堆中，任意节点的值都不小于其子节点的值。这意味着堆顶（根节点）是整个堆中的最大值。大根堆常用于实现优先队列，快速访问和删除最大元素。
小根堆：与大根堆相反，在小根堆中，任意节点的值都不大于其子节点的值。这样，堆顶是整个堆中的最小值。小根堆用于需要快速访问和删除最小元素的场景，如实现升序堆排序。

在这里插入图片描述

堆通常使用数组来表示，这种表示法不仅节省空间，而且能够通过索引快速访问任何节点，特别是在二叉堆中更为常见。二叉堆是实现堆结构的一种简单且高效的方法，特别适合进行插入和删除根节点的操作。

在二叉堆的数组表示中，我们不使用数组的第一个位置（索引0），使得索引计算更直观。这种方法的主要优点是可以直接通过简单的公式计算父节点和子节点的位置，无需额外的指针或链接。

数组的结构：堆可以被视为一个完全二叉树，树中的每一层从左到右填满，只有最底层可能未完全填满，且也是从左到右填入。这使得数组的连续空间可以有效地表示树的结构。

在二叉堆的数组表示中，节点之间的父子关系通过数组索引来表示，具体计算方法如下：

父节点到子节点的索引计算：
- 对于任何位于索引 i 的节点，其左子节点的索引为 2*i。
- 右子节点的索引为 2*i + 1。
这样的索引计算保证了无论堆多大，左右子节点的查找都是常数时间的操作。
子节点到父节点的索引计算：
- 对于任何位于索引 i 的节点，其父节点的索引为 i/2（整除）。
这个计算同样有效快速，使得从子节点访问父节点也是一个常数时间的操作。

在这里插入图片描述

这种索引方法的优点是简单和高效，能够迅速定位到任何节点的父节点或子节点，这对于执行堆操作如插入和删除至关重要。通过这样的结构，插入新节点或删除节点（特别是堆顶节点）时，都能快速调整堆以维持其性质。

堆作为一种高效的数据结构，主要用于优先队列的实现，其效率在很大程度上依赖于几个核心操作的高效执行：插入、删除和堆化。这些操作都必须能够快速调整堆以保持其基本性质，无论是大根堆还是小根堆。

在堆中插入新元素通常涉及以下步骤：

步骤1：添加至末尾
新元素首先被添加到堆的末尾，即数组的最后。这一步保持了完全二叉树的结构。
步骤2：上浮调整（Percolate Up）
插入元素后，如果它违反了堆的性质（例如，在大根堆中，如果这个新元素比它的父节点大），则需要进行调整。新元素与其父节点比较，如果条件满足（大根堆中比父节点大，小根堆中比父节点小），则与父节点交换位置，这一过程称为“上浮”。这一过程重复进行，直到新元素到达一个位置，它不再违反堆的性质或者已经到达堆的顶部。

堆的删除操作通常指删除堆顶元素，这是因为堆主要用于访问和移除其顶部元素（最大或最小）。删除堆顶元素的步骤如下：

步骤1：移除顶部
移除堆顶元素后，通常将堆中的最后一个元素移至顶部，以保持完全二叉树的结构。
步骤2：下沉调整（Percolate Down）
将最后一个元素移至顶部后，开始进行“下沉”操作以重新恢复堆的性质。这一过程涉及将新的顶部元素与其子节点比较，并与其中更大（大根堆）或更小（小根堆）的子节点进行交换，直到该元素处于正确的位置或到达叶子节点层。

堆化是创建或重建堆的过程，特别是从一个无序的数组开始构建堆时使用。这个过程关键在于从最后一个非叶子节点开始，逐个向上进行下沉调整：

堆结构由于其高效的插入和删除最大或最小元素的特性，被广泛应用于多种算法和数据结构中，尤其是在优先队列、排序和图算法中的应用最为突出。下面详细介绍这些应用。

优先队列是一种特殊的队列，其中的元素带有优先级，优先级最高的元素最先被移除。堆结构是实现优先队列的理想选择：

堆排序是一种利用堆进行排序的算法，它通过堆的特性来实现高效的排序过程：

过程描述：
- 建堆：首先将所有待排序的元素构建成一个堆，确保所有的父节点都大于或小于其子节点（大根堆或小根堆）。
- 排序：将堆顶元素（最大或最小）与堆的最后一个元素交换，然后减少堆的大小，并对新的堆顶元素进行下沉操作以重新满足堆的条件。重复此过程，直到堆中仅剩下一个元素。
效率：堆排序的时间复杂度为 O(n log n)，且不需要额外的存储空间，使其成为一种效率和资源使用都优良的排序方法。