数据结构之堆

最新推荐文章于 2023-09-12 19:34:59 发布

chsmy2018

最新推荐文章于 2023-09-12 19:34:59 发布

阅读量160

点赞数

分类专栏：数据结构与算法

本文链接：https://blog.csdn.net/mingyunxiaohai/article/details/86704058

版权

数据结构与算法专栏收录该内容

19 篇文章 3 订阅

订阅专栏

此文是数据结构与算法之美的学习笔记

堆的概念

堆是一种特殊的数，应用场景很多，最经典的就是堆排序，堆排序是一种原地排序，时间复杂度是O(nlogn)

堆的特点

堆是一个完全二叉树（除了最后一层，其他层的节点的个数都是满的，最后一层的节点都是靠左排列）
堆中的每个节点的值都必须大于等于或者小于等于其子树中的每个节点的值

每个节点的值都大于等于子树中每个节点的值的堆叫做“大顶堆”，每个节点的值都小于等于子树中每个节点的值的堆叫做“小顶堆”

堆的存储

完全二叉树适合用数组来存储，因为我们不需要存储左右子节点的指针，所以用数组存储完全二叉树比较节省空间。通过下标就能找到其左右子节点和父节点

比如下标为i的节点的左子节点就是下标为i2的节点，右子节点就是下标为i2+1的节点，父节点就是下标为i/2的节点

堆的操作

1.插入

插入一个元素都，很可能就不满足堆的特性了，我们需要调整让其重新满足特性，这个过程叫做“堆化”

堆化可以分为从上往下和从下往上两种堆化的方法。也就是顺着节点所在的路径往上或者往下比较然后交换。

代码：

public class Heap {
  private int[] a; // 数组，从下标 1 开始存储数据
  private int n;  // 堆可以存储的最大数据个数
  private int count; // 堆中已经存储的数据个数

  public Heap(int capacity) {
    a = new int[capacity + 1];
    n = capacity;
    count = 0;
  }

  public void insert(int data) {
    if (count >= n) return; // 堆满了
    ++count;
    a[count] = data;
    int i = count;
    while (i/2 > 0 && a[i] > a[i/2]) { // 自下往上堆化
      swap(a, i, i/2); // swap() 函数作用：交换下标为 i 和 i/2 的两个元素
      i = i/2;
    }
  }
 }

2.删除堆顶元素

通过堆的第二条特征我们知道，堆顶的元素就是最大或者最小的元素，当我们删除堆顶的元素之后，这个节点就变成了一个空节点，然后让它跟第二大元素位置互换，以此类推，知道这个空节点到成为了叶子节点

上面的方法会出现一个问题，最后叶子节点可能出现在右边，完全二叉树的定义，也就不是一个堆了。

解决这个问题很简单，元素删除后，先把最后一个节点放在栈顶，然后这个节点跟其子节点对比交换，重复此过程直到父子节点满足关系为止。

代码：

public void removeMax() {
  if (count == 0) return -1; // 堆中没有数据
  a[1] = a[count];
  --count;
  heapify(a, count, 1);
}

private void heapify(int[] a, int n, int i) { // 自上往下堆化
  while (true) {
    int maxPos = i;
    if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
    if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
    if (maxPos == i) break;
    swap(a, i, maxPos);
    i = maxPos;
  }
}

堆排序可以分成两个步骤

1.建堆
第一种：假设堆中只有一个数据，下标为1，然后根据上面堆的插入的逻辑，从下标2到n依次插入就完成了
第二种：因为叶子节点往下堆化只能跟自己比较，所以从第一个非叶子节点开始依次堆化。

private static void buildHeap(int[] a, int n) {
  for (int i = n/2; i >= 1; --i) {
    heapify(a, n, i);
  }
}

private static void heapify(int[] a, int n, int i) {
  while (true) {
    int maxPos = i;
    if (i*2 <= n && a[i] < a[i*2]) maxPos = i*2;
    if (i*2+1 <= n && a[maxPos] < a[i*2+1]) maxPos = i*2+1;
    if (maxPos == i) break;
    swap(a, i, maxPos);
    i = maxPos;
  }
}

从下标为n/2开始到1的数据进行堆化。下标从n/2+1到n的节点都是叶子节点。

完全二叉树从n/2到n的节点都是叶子节点。

2.排序

堆建完之后，数组中的数据就是按照堆的特性来组织了，数组中的第一个元素就是堆顶的元素，也就是最大或者最小的元素。

如果是大顶堆，总共n个元素。我们把堆顶的元素放到数组的最后一个位置也就是n的位置，然后把最后一个位置放到堆顶，然后剩下的n-1个元素执行堆化的方法。堆化完成之后子在取堆顶元素放在n-1的位置，以此类推直到最后堆中只剩下1个元素为止。

// n 表示数据的个数，数组 a 中的数据从下标 1 到 n 的位置。
public static void sort(int[] a, int n) {
  buildHeap(a, n);
  int k = n;
  while (k > 1) {
    swap(a, 1, k);
    --k;
    heapify(a, k, 1);
  }
}