青少年编程与数学 02-018 C++数据结构与算法 07课题、堆

最新推荐文章于 2025-04-29 07:36:52 发布

明月看潮生

最新推荐文章于 2025-04-29 07:36:52 发布

阅读量747

点赞数 35

分类专栏：编程与数学第02阶段文章标签：青少年编程 c++ 编程与数学数据结构算法

本文链接：https://blog.csdn.net/qq_40071585/article/details/147467680

版权

编程与数学第02阶段专栏收录该内容

340 篇文章

订阅专栏

青少年编程与数学 02-018 C++数据结构与算法 07课题、堆

一、堆
二、最大堆的实现
三、最小堆的实现
四、建堆操作
五、堆的应用

课题摘要：
在数据结构中，堆（Heap）是一种特殊的完全二叉树。
堆首先是一个完全二叉树，即除了最后一层外，每一层都被完全填满，并且所有节点都尽可能地向左对齐。

一、堆

在数据结构中，堆（Heap）是一种特殊的完全二叉树，具有以下特点：

1. 定义

完全二叉树：堆首先是一个完全二叉树，即除了最后一层外，每一层都被完全填满，并且所有节点都尽可能地向左对齐。
堆序性质：堆的节点值必须满足特定的顺序关系，分为两种类型：
- 最大堆（大顶堆）：每个父节点的值都大于或等于其子节点的值。在最大堆中，根节点是所有节点中值最大的。
- 最小堆（小顶堆）：每个父节点的值都小于或等于其子节点的值。在最小堆中，根节点是所有节点中值最小的。

2. 堆的存储方式

堆通常使用数组来存储，而不是像普通二叉树那样使用指针。对于数组中的第i个元素，其左子节点的索引为2i + 1，右子节点的索引为2i + 2，而其父节点的索引为(i - 1) / 2（向下取整）。

3. 堆的常见操作

插入元素：
- 将新元素添加到堆的末尾（即数组的最后一个位置）。
- 然后通过“上浮”操作（与父节点比较并交换，直到满足堆序性质）将其调整到合适的位置。
删除元素：
- 通常删除的是堆顶元素（最大堆中是最大值，最小堆中是最小值）。
- 将堆的最后一个元素移到堆顶，然后通过“下沉”操作（与子节点比较并交换，直到满足堆序性质）将其调整到合适的位置。
调整堆：当堆的某个节点的值发生变化时，需要通过上浮或下沉操作来重新调整堆，以保持堆的性质。
建堆：将一个无序的数组调整成一个堆。可以通过自底向上或自顶向下两种方式来实现。

4. 堆的应用

优先队列：堆是实现优先队列的常用数据结构。优先队列可以快速地获取优先级最高的元素（最大堆或最小堆的堆顶元素），并且能够高效地插入和删除元素。
堆排序：利用堆的性质可以实现一种高效的排序算法。通过建堆、不断删除堆顶元素并将其放到数组的末尾，可以实现对数组的排序。
数据压缩：在霍夫曼编码等数据压缩算法中，堆可以用于高效地管理编码树的构造过程。
资源分配：在操作系统中，堆可以用于管理资源的分配，根据资源的优先级进行调度。

总之，堆是一种非常重要的数据结构，它在很多领域都有广泛的应用，其高效的插入、删除和获取最值操作使其在处理优先级相关问题时具有很大的优势。

二、最大堆的实现

1. 堆的存储

我们使用数组来存储堆，数组的索引从0开始。对于索引为i的节点：

其左子节点的索引为2 * i + 1
其右子节点的索引为2 * i + 2
其父节点的索引为(i - 1) / 2

2. 基本操作

上浮（Sift Up）：用于插入新元素后调整堆。
下沉（Sift Down）：用于删除堆顶元素后调整堆。
插入元素（Insert）：将新元素添加到数组末尾，然后上浮。
删除堆顶元素（Extract Max）：删除堆顶元素，将最后一个元素放到堆顶，然后下沉。
建堆（Heapify）：将一个无序数组调整为堆。

3. C++代码实现

#include <iostream>
#include <vector>
using namespace std;

class MaxHeap {
private:
    vector<int> heap;

    int parent(int i) {
        return (i - 1) / 2;
    }

    int leftChild(int i) {
        return 2 * i + 1;
    }

    int rightChild(int i) {
        return 2 * i + 2;
    }

    void siftUp(int i) {
        while (i > 0 && heap[parent(i)] < heap[i]) {
            swap(heap[parent(i)], heap[i]);
            i = parent(i);
        }
    }

    void siftDown(int i) {
        int maxIndex = i;
        int left = leftChild(i);
        if (left < heap.size() && heap[left] > heap[maxIndex]) {
            maxIndex = left;
        }

        int right = rightChild(i);
        if (right < heap.size() && heap[right] > heap[maxIndex]) {
            maxIndex = right;
        }

        if (i != maxIndex) {
            swap(heap[i], heap[maxIndex]);
            siftDown(maxIndex);
        }
    }

public:
    void insert(int value) {
        heap.push_back(value);
        siftUp(heap.size() - 1);
    }

    int extractMax() {
        if (heap.empty()) {
            return -1; // 返回一个错误值，表示堆为空
        }
        int max_value = heap[0];
        heap[0] = heap.back();
        heap.pop_back();
        if (!heap.empty()) {
            siftDown(0);
        }
        return max_value;
    }

    void heapify(const vector<int>& array) {
        heap = array;
        for (int i = heap.size() / 2 - 1; i >= 0; --i) {
            siftDown(i);
        }
    }

    int getMax() {
        if (heap.empty()) {
            return -1; // 返回一个错误值，表示堆为空
        }
        return heap[0];
    }

    void printHeap() {
        for (int value : heap) {
            cout << value << " ";
        }
        cout << endl;
    }
};

// 示例用法
int main() {
    MaxHeap maxHeap;
    maxHeap.insert(10);
    maxHeap.insert(20);
    maxHeap.insert(15);
    maxHeap.insert(30);
    maxHeap.insert(40);

    cout << "当前最大堆： ";
    maxHeap.printHeap();
    cout << "堆顶元素： " << maxHeap.getMax() << endl;
    cout << "删除堆顶元素： " << maxHeap.extractMax() << endl;
    cout << "删除后的最大堆： ";
    maxHeap.printHeap();

    vector<int> array = {12, 7, 1, 3, 10, 17, 19, 2, 5};
    maxHeap.heapify(array);
    cout << "建堆后的最大堆： ";
    maxHeap.printHeap();

    return 0;
}

4. 代码说明

初始化：
- 使用vector<int>来存储堆。
索引计算：
- parent、leftChild和rightChild方法用于计算父节点和子节点的索引。
上浮操作：
- siftUp方法用于将新插入的元素上浮到合适的位置，直到满足最大堆的性质。
下沉操作：
- siftDown方法用于将堆顶元素下沉到合适的位置，直到满足最大堆的性质。
插入操作：
- insert方法将新元素添加到数组末尾，然后调用siftUp进行调整。
删除堆顶元素：
- extractMax方法删除堆顶元素，将最后一个元素移到堆顶，然后调用siftDown进行调整。
建堆：
- heapify方法将一个无序数组调整为最大堆，从最后一个非叶子节点开始逐个调用siftDown。
获取堆顶元素：
- getMax方法返回堆顶元素（最大值）。
打印堆：
- printHeap方法用于打印堆的内容。

5. 示例输出

假设输入的数组为{12, 7, 1, 3, 10, 17, 19, 2, 5}，运行代码后可能的输出如下：

当前最大堆： 40 30 15 10 20
堆顶元素： 40
删除堆顶元素： 40
删除后的最大堆： 30 20 15 10
建堆后的最大堆： 19 17 12 2 10 1 5 3 7

三、最小堆的实现

最小堆的实现与最大堆类似，唯一的区别在于堆序性质相反（父节点值小于或等于子节点值）。以下是实现最小堆的关键代码部分：

void siftUp(int i) {
    while (i > 0 && heap[parent(i)] > heap[i]) {
        swap(heap[parent(i)], heap[i]);
        i = parent(i);
    }
}

void siftDown(int i) {
    int minIndex = i;
    int left = leftChild(i);
    if (left < heap.size() && heap[left] < heap[minIndex]) {
        minIndex = left;
    }

    int right = rightChild(i);
    if (right < heap.size() && heap[right] < heap[minIndex]) {
        minIndex = right;
    }

    if (i != minIndex) {
        swap(heap[i], heap[minIndex]);
        siftDown(minIndex);
    }
}

其他方法（如insert、extractMin等）与最大堆类似，只需将比较操作符从>改为<即可。

四、建堆操作

建堆操作（Heapify）是将一个无序的数组转换为一个合法的堆（最大堆或最小堆）的过程。这个操作是堆数据结构中的一个重要步骤，尤其是在实现堆排序算法时。以下是关于建堆操作的详细解释，包括其原理、步骤和代码实现。

1. 建堆操作的原理

建堆操作的目标是将一个无序数组调整为一个满足堆序性质的堆。堆序性质是指：

最大堆：每个父节点的值都大于或等于其子节点的值。
最小堆：每个父节点的值都小于或等于其子节点的值。

建堆操作的核心思想是从最后一个非叶子节点开始，逐个向下调整（Sift Down）每个节点，直到整个数组满足堆序性质。

2. 为什么从最后一个非叶子节点开始？

在完全二叉树中，最后一个非叶子节点的索引可以通过公式计算：
[ \text{last_non_leaf_index} = \left\lfloor \frac{n - 2}{2} \right\rfloor ]
其中，( n ) 是数组的长度。

从最后一个非叶子节点开始的原因是：

叶子节点本身已经是一个合法的堆（因为它们没有子节点）。
从最后一个非叶子节点开始逐个调整，可以确保在调整某个节点时，其子树已经是一个合法的堆。

3. 建堆操作的步骤

初始化：将无序数组存储到一个数组中。
找到最后一个非叶子节点：计算最后一个非叶子节点的索引。
逐个调整：从最后一个非叶子节点开始，逐个向下调整每个节点，直到根节点。

4. 代码实现

以下是最大堆的建堆操作的 C++ 实现：

#include <iostream>
#include <vector>
using namespace std;

class MaxHeap {
private:
    vector<int> heap;

    int parent(int i) {
        return (i - 1) / 2;
    }

    int leftChild(int i) {
        return 2 * i + 1;
    }

    int rightChild(int i) {
        return 2 * i + 2;
    }

    void siftDown(int i) {
        int maxIndex = i;
        int left = leftChild(i);
        if (left < heap.size() && heap[left] > heap[maxIndex]) {
            maxIndex = left;
        }

        int right = rightChild(i);
        if (right < heap.size() && heap[right] > heap[maxIndex]) {
            maxIndex = right;
        }

        if (i != maxIndex) {
            swap(heap[i], heap[maxIndex]);
            siftDown(maxIndex);
        }
    }

public:
    MaxHeap(const vector<int>& array) {
        heap = array;
        heapify();
    }

    void heapify() {
        int n = heap.size();
        int lastNonLeafIndex = (n - 2) / 2;
        for (int i = lastNonLeafIndex; i >= 0; --i) {
            siftDown(i);
        }
    }

    void printHeap() {
        for (int value : heap) {
            cout << value << " ";
        }
        cout << endl;
    }
};

// 示例用法
int main() {
    vector<int> array = {12, 7, 1, 3, 10, 17, 19, 2, 5};
    MaxHeap maxHeap(array);
    cout << "建堆后的最大堆： ";
    maxHeap.printHeap();
    return 0;
}

5. 代码说明

初始化：
- 如果传入了一个数组，直接复制该数组到heap，并调用heapify方法进行建堆。
计算最后一个非叶子节点：
- 使用公式lastNonLeafIndex = (n - 2) / 2计算最后一个非叶子节点的索引。
逐个调整：
- 从最后一个非叶子节点开始，逐个调用siftDown方法，将每个节点调整到合适的位置，直到整个数组满足最大堆的性质。

6. 示例输出

假设输入的数组为{12, 7, 1, 3, 10, 17, 19, 2, 5}，运行代码后可能的输出如下：

建堆后的最大堆： 19 17 12 2 10 1 5 3 7

7. 时间复杂度分析

建堆操作的时间复杂度是(O(n))。虽然看起来有两层循环（外层循环从最后一个非叶子节点到根节点，内层循环是siftDown），但实际的时间复杂度并不是(O(n \log n))。这是因为越靠近根节点的元素，其子树越小，调整的次数也越少。经过数学分析，建堆操作的总时间复杂度为(O(n))。

8. 总结

建堆操作是将一个无序数组转换为一个合法堆的过程，通过从最后一个非叶子节点开始逐个调整节点，可以高效地完成建堆。建堆操作是堆排序算法中的关键步骤，也是堆数据结构中的一个重要操作。

五、堆的应用

堆（Heap）是一种非常灵活且高效的数据结构，广泛应用于计算机科学的各个领域。以下是堆的一些主要应用，按不同场景分类介绍：

1. 优先队列（Priority Queue）

优先队列是一种特殊的队列，其中每个元素都有一个优先级，优先级最高的元素最先被取出。堆是实现优先队列的最常用数据结构之一，因为堆能够高效地支持以下操作：

插入元素：将一个新元素插入到优先队列中，时间复杂度为 (O(\log n))。
获取最高优先级元素：快速获取优先队列中优先级最高的元素，时间复杂度为 (O(1))。
删除最高优先级元素：移除优先队列中优先级最高的元素，时间复杂度为 (O(\log n))。

应用场景：

任务调度：操作系统中，根据任务的优先级调度进程或线程。
事件驱动模拟：在模拟系统中，根据事件的时间顺序处理事件。
资源分配：根据资源的优先级分配有限的资源。

2. 堆排序（Heap Sort）

堆排序是一种高效的排序算法，利用堆的性质对数组进行排序。堆排序的基本步骤如下：

建堆：将无序数组转换为一个最大堆（或最小堆）。
排序：重复以下步骤，直到堆为空：
- 删除堆顶元素（最大值或最小值），并将其放到数组的末尾。
- 将堆的最后一个元素移到堆顶，然后调整堆以恢复堆序性质。

堆排序的时间复杂度为 (O(n \log n))，并且是一种不稳定的排序算法。

应用场景：

通用排序：对数组或列表进行排序，尤其是在需要原地排序（不使用额外空间）的场景中。
数据预处理：在数据挖掘或机器学习中，对数据进行预处理和排序。

3. 数据压缩

堆在数据压缩算法中也有重要应用，例如霍夫曼编码（Huffman Coding）。霍夫曼编码是一种基于字符频率的无损压缩算法，通过构建霍夫曼树来实现高效的编码和解码。

应用场景：

文件压缩：如 ZIP、GZIP 等压缩工具中，霍夫曼编码用于压缩文本文件。
网络传输：在传输大量数据时，使用霍夫曼编码减少数据量。

4. 中位数查找

堆可以用于高效地查找数据流中的中位数。通过维护两个堆（一个最大堆和一个最小堆），可以动态地插入新元素并快速获取中位数。

应用场景：

实时数据分析：在处理实时数据流时，快速计算中位数。
统计分析：在统计学中，快速计算一组数据的中位数。

5. K 个最小（或最大）元素

堆可以用于快速找到数组中的前 K 个最小（或最大）元素。通过维护一个大小为 K 的最大堆（或最小堆），可以高效地实现这一目标。

应用场景：

搜索引擎：在搜索引擎中，快速找到最相关的 K 个结果。
推荐系统：在推荐系统中，快速找到用户最感兴趣的 K 个商品或内容。

6. 图算法

堆在图算法中也有广泛应用，尤其是在处理最短路径问题（如 Dijkstra 算法）和最小生成树问题（如 Prim 算法）时。通过使用优先队列（基于堆实现），可以显著提高这些算法的效率。

应用场景：

最短路径：在地图导航系统中，计算从起点到终点的最短路径。
网络设计：在通信网络或电力网络中，设计最小生成树以最小化成本。

7. 资源管理

堆可以用于管理有限的资源，根据资源的优先级进行分配和回收。

应用场景：

内存管理：在操作系统中，根据内存块的大小和优先级分配内存。
设备调度：在多用户系统中，根据用户的优先级分配设备资源。

8. 游戏开发

在游戏开发中，堆可以用于管理游戏对象的优先级，例如：

事件处理：根据事件的优先级处理游戏中的事件。
AI决策：根据决策的优先级选择最优的行动方案。

9. 分布式系统

在分布式系统中，堆可以用于管理任务队列，根据任务的优先级分配任务。

应用场景：

任务调度：在分布式计算中，根据任务的优先级分配计算资源。
负载均衡：根据服务器的负载情况，动态分配请求。

总结

堆是一种非常强大的数据结构，其高效的操作（如插入、删除和获取最值）使其在许多领域都有广泛的应用。无论是优先队列、排序算法，还是数据压缩、图算法，堆都能提供高效的解决方案。