【ShuQiHere】二叉堆与堆排序：从优先队列到高效排序的全面解析

ShuQiHere

于 2024-09-18 00:09:41 发布

阅读量833

点赞数 20

分类专栏：【ShuQiHere】数据结构与算法文章标签： java 开发语言

本文链接：https://blog.csdn.net/wangshuqi666/article/details/142316920

版权

【ShuQiHere】数据结构与算法专栏收录该内容

9 篇文章 1 订阅

订阅专栏

【ShuQiHere】🚀

引言

在计算机科学的世界中，数据结构 和算法是程序设计的基石。无论是任务调度、路径规划，还是大型数据的整理，排序算法的效率都直接影响着程序的性能。堆排序（Heapsort） 作为一种基于 二叉堆（Binary Heap） 的排序算法，具有 $\log n)$ 的时间复杂度，并且不需要额外的存储空间。通过深入理解二叉堆和堆排序，我们可以高效地处理优先队列问题，实现快速的数据排序。本文将全面解析二叉堆和堆排序的工作原理，结合丰富的例子和代码，帮助你深入理解这些算法的细节。

什么是二叉堆？🌳
优先队列的实现：堆的插入与删除操作🎯
- 插入操作（Insert）
- 删除最小值（Delete Min）
堆排序（Heapsort）：堆的实际应用🚀
堆排序的复杂度分析🧮
应用场景：堆与优先队列的实际应用🌟
结论：掌握二叉堆与堆排序的力量💪
- 学习建议
- 展望

1. 什么是二叉堆？🌳

二叉堆的定义

二叉堆 是一种特殊的 完全二叉树（Complete Binary Tree），满足以下两个关键性质：

结构性质（Structure Property）：除了最后一层外，二叉堆的每一层都是满的，最后一层的节点从左到右紧密排列，没有空隙。
堆序性质（Heap Order Property）：
- 最小堆（Min-Heap）：每个节点的值都小于或等于其子节点的值，堆顶为最小值。
- 最大堆（Max-Heap）：每个节点的值都大于或等于其子节点的值，堆顶为最大值。

二叉堆的性质

高度（Height）：对于 n 个元素的二叉堆，堆的高度为 $O(\log n)$ 。
平衡性（Balance）：二叉堆是一棵完全二叉树，保证了树的平衡性，操作效率高。
索引关系：通过数组实现时，节点与其子节点、父节点的索引关系非常紧凑，有助于高效地定位和操作节点。

二叉堆的应用

优先队列（Priority Queue）：实现高效的插入和删除操作，适用于任务调度、算法优化等场景。
图算法：如 Dijkstra 最短路径算法、Prim 最小生成树算法等，都利用了优先队列的特性。
事件模拟器：在离散事件模拟中，用于管理事件的调度。

数组实现二叉堆

二叉堆通常使用数组来实现，以节省空间和提高效率。对于数组中的元素：

父节点（Parent） 的索引：parent(i) = (i - 1) / 2
左子节点（Left Child） 的索引：left(i) = 2 * i + 1
右子节点（Right Child） 的索引：right(i) = 2 * i + 2

例子：

假设有一个堆数组 [10, 20, 30, 40, 50, 60, 70]，其对应的二叉堆结构如下：

          10
         /   \
       20     30
      /  \   /  \
    40   50 60  70

通过索引关系，可以快速定位父子节点，从而高效地执行堆的操作。

2. 优先队列的实现：堆的插入与删除操作🎯

插入操作（Insert）

插入新元素 时，将元素添加到堆的末尾，然后通过上滤（Percolate Up） 操作，恢复堆序性质。

上滤（Percolate Up）步骤：

插入元素：将新元素放在堆的最后一个位置。
比较和交换：
- 比较新元素与其父节点的值。
- 如果新元素小于父节点（对于最小堆），交换两者。
重复步骤 2，直到新元素的父节点小于或等于新元素，或者到达堆顶。

代码实现：

public class MinHeap {
    private int[] heap;
    private int size;
    private int capacity;

    public MinHeap(int capacity) {
        this.capacity = capacity;
        this.heap = new int[capacity];
        this.size = 0;
    }

    // 插入新元素
    public void insert(int value) {
        if (size == capacity) {
            throw new IllegalStateException("Heap is full");
        }
        heap[size] = value;
        int current = size;
        size++;
        // 上滤操作
        while (current > 0 && heap[current] < heap[(current - 1) / 2]) {
            swap(current, (current - 1) / 2);
            current = (current - 1) / 2;
        }
    }

    // 交换元素
    private void swap(int i, int j) {
        int temp = heap[i];
        heap[i] = heap[j];
        heap[j] = temp;
    }

    // 打印堆
    public void printHeap() {
        for (int i = 0; i < size; i++) {
            System.out.print(heap[i] + " ");
        }
        System.out.println();
    }
}

示例：插入元素

public class Main {
    public static void main(String[] args) {
        MinHeap minHeap = new MinHeap(10);
        minHeap.insert(40);
        minHeap.insert(20);
        minHeap.insert(30);
        minHeap.insert(10);
        minHeap.printHeap(); // 输出: 10 20 30 40
    }
}

输出：

10 20 30 40

删除最小值（Delete Min）

删除堆顶元素（最小值） 时，将堆的最后一个元素移动到堆顶，然后通过下滤（Percolate Down） 操作，恢复堆序性质。

下滤（Percolate Down）步骤：

替换堆顶元素：将堆尾元素移动到堆顶，减少堆的大小。
比较和交换：
- 比较新堆顶元素与其子节点的值。
- 如果新堆顶元素大于最小的子节点，交换两者。
重复步骤 2，直到新堆顶元素小于或等于其子节点，或者达到叶节点。

代码实现：

public int deleteMin() {
    if (size == 0) {
        throw new NoSuchElementException("Heap is empty");
    }
    int min = heap[0];
    heap[0] = heap[size - 1];
    size--;
    percolateDown(0);
    return min;
}

private void percolateDown(int index) {
    int smallest = index;
    int left = 2 * index + 1;
    int right = 2 * index + 2;

    if (left < size && heap[left] < heap[smallest]) {
        smallest = left;
    }
    if (right < size && heap[right] < heap[smallest]) {
        smallest = right;
    }
    if (smallest != index) {
        swap(index, smallest);
        percolateDown(smallest);
    }
}

示例：删除最小值

public class Main {
    public static void main(String[] args) {
        MinHeap minHeap = new MinHeap(10);
        minHeap.insert(40);
        minHeap.insert(20);
        minHeap.insert(30);
        minHeap.insert(10);
        System.out.println("初始堆:");
        minHeap.printHeap(); // 输出: 10 20 30 40

        int min = minHeap.deleteMin();
        System.out.println("删除的最小值: " + min); // 输出: 10
        System.out.println("删除最小值后的堆:");
        minHeap.printHeap(); // 输出: 20 40 30
    }
}

输出：

初始堆:
10 20 30 40 
删除的最小值: 10
删除最小值后的堆:
20 40 30

3. 堆排序（Heapsort）：堆的实际应用🚀

堆排序的步骤

堆排序是利用堆这种数据结构设计的一种排序算法。其基本思想是：

构建最大堆（Build Max-Heap）：
- 将无序数组构建为一个最大堆。
排序过程：
- 将堆顶元素（最大值）与当前堆的最后一个元素交换。
- 缩小堆的范围（排除已排序的元素），对新的堆顶元素进行下滤操作，恢复堆性质。
- 重复上述过程，直到堆的大小为 1。

堆排序的完整实现

代码实现：

public class HeapSort {
    public static void heapSort(int[] array) {
        int n = array.length;
        // 构建最大堆
        for (int i = n / 2 - 1; i >= 0; i--) {
            heapify(array, n, i);
        }
        // 逐一将最大元素移到数组末尾
        for (int i = n - 1; i > 0; i--) {
            swap(array, 0, i);      // 将当前最大元素移到末尾
            heapify(array, i, 0);   // 对堆顶元素进行下滤
        }
    }

    // 堆化函数
    private static void heapify(int[] array, int n, int i) {
        int largest = i;            // 初始化最大元素为堆顶
        int left = 2 * i + 1;       // 左子节点
        int right = 2 * i + 2;      // 右子节点

        // 如果左子节点存在且大于根节点
        if (left < n && array[left] > array[largest]) {
            largest = left;
        }
        // 如果右子节点存在且大于目前最大值
        if (right < n && array[right] > array[largest]) {
            largest = right;
        }
        // 如果最大值不是根节点，交换并继续堆化
        if (largest != i) {
            swap(array, i, largest);
            heapify(array, n, largest);
        }
    }

    // 交换函数
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }
}

示例：

public class Main {
    public static void main(String[] args) {
        int[] array = {12, 11, 13, 5, 6, 7};
        System.out.println("原始数组:");
        printArray(array);

        HeapSort.heapSort(array);

        System.out.println("排序后的数组:");
        printArray(array);
    }

    // 打印数组
    private static void printArray(int[] array) {
        for (int num : array) {
            System.out.print(num + " ");
        }
        System.out.println();
    }
}

输出：

原始数组:
12 11 13 5 6 7 
排序后的数组:
5 6 7 11 12 13

堆排序优化

原地建堆：在原数组上构建堆，避免额外的空间开销。
自底向上建堆：从最后一个非叶节点开始下滤，效率更高。
减少交换次数：在堆化过程中，使用赋值代替交换，优化性能。

4. 堆排序的复杂度分析🧮

时间复杂度

构建堆：
- 总的比较和交换次数为 $O (n)$ 。
- 原因：每个节点的下滤操作次数与其高度成正比，所有节点的总高度和为 $O (n)$ 。
排序过程：
- 进行 $n - 1$ 次交换和下滤操作。
- 每次下滤的时间复杂度为 $O(\log n)$ 。
- 因此，排序过程的总时间复杂度为 $\log n)$ 。

总时间复杂度： $\log n)$

空间复杂度

空间复杂度： $O (1)$
原因：堆排序在原数组上进行，不需要额外的辅助空间（递归调用栈除外）。

堆排序 vs 快速排序

堆排序：

时间复杂度：最坏、平均、最好情况下均为 $\log n)$ 。
空间复杂度： $O (1)$ ，原地排序。
稳定性：不稳定排序。

快速排序：

时间复杂度：
- 平均情况： $\log n)$
- 最坏情况： $O(n^2)$ （当数据有序或逆序时）
空间复杂度： $O(\log n)$ ，由于递归调用栈。
稳定性：不稳定排序。

选择建议：

数据规模较大，且对最坏情况有要求：选择堆排序。
一般情况下追求平均性能：选择快速排序。

5. 应用场景：堆与优先队列的实际应用🌟

任务调度

在多任务系统中，需要按照任务的优先级执行。使用最小堆（或最大堆）实现优先队列，可以高效地插入和取出最高优先级的任务。

示例：

PriorityQueue<Task> taskQueue = new PriorityQueue<>(Comparator.comparingInt(Task::getPriority));

taskQueue.offer(new Task("任务1", 5));
taskQueue.offer(new Task("任务2", 1));
taskQueue.offer(new Task("任务3", 3));

while (!taskQueue.isEmpty()) {
    Task task = taskQueue.poll();
    System.out.println("执行：" + task.getName());
}

输出：

执行：任务2
执行：任务3
执行：任务1

图算法中的应用

Dijkstra 算法 和 Prim 算法 中，都使用了优先队列来选择下一个最小距离的节点。

示例：Dijkstra 算法中的优先队列

public void dijkstra(int start) {
    int[] dist = new int[n];
    Arrays.fill(dist, Integer.MAX_VALUE);
    dist[start] = 0;

    PriorityQueue<Node> pq = new PriorityQueue<>(Comparator.comparingInt(Node::getDistance));
    pq.offer(new Node(start, 0));

    while (!pq.isEmpty()) {
        Node node = pq.poll();
        int u = node.getId();

        for (Edge edge : adjList[u]) {
            int v = edge.to;
            int weight = edge.weight;
            if (dist[u] + weight < dist[v]) {
                dist[v] = dist[u] + weight;
                pq.offer(new Node(v, dist[v]));
            }
        }
    }
}

实时数据处理

在处理实时数据流时，需要维护一个大小为 k 的最小（或最大）元素集合。使用堆可以高效地实现这一需求。

示例：Top K 问题

public List<Integer> topK(int[] nums, int k) {
    PriorityQueue<Integer> minHeap = new PriorityQueue<>();
    for (int num : nums) {
        if (minHeap.size() < k) {
            minHeap.offer(num);
        } else if (num > minHeap.peek()) {
            minHeap.poll();
            minHeap.offer(num);
        }
    }
    List<Integer> result = new ArrayList<>(minHeap);
    Collections.sort(result, Collections.reverseOrder());
    return result;
}