边学边记——数据结构☞堆(包括优先级队列的介绍)

目录

一、堆(二叉堆) 

堆是用来干什么的?

堆是用什么存储结构存储的?

1. 堆的概念

2. 堆的性质 

3. 堆的存储方式

下标之间的规则:

4. 堆的基本操作

(1). 向下调整/堆化操作

(2).堆的创建

(3).堆的插入

(4).堆的删除

(5). 堆最主要的应用:优先级队列(假设小堆)

二、常用接口介绍

1. PriorityQueue的特性

2.PriorityQueue常用接口介绍

(1).优先级队列的构造

(2).插入/删除/获取优先级最高的元素

三、堆的应用

1.PriorityQueue的实现

2.堆排序


一、堆(二叉堆) 

堆是用来干什么的?

        在一组不断变化的(随时在添加,删除元素)集合中,快速找到 "最值" (最大值or最小值)。

堆是用什么存储结构存储的?

        二叉树结构存储。假设使用线性链表结构进行维护,添加和删除的时间复杂度是O(1),但是想找到此刻的最大值,只能进行遍历,时间复杂度为O(n)。

补充:二叉树是可以使用顺序结构进行维护的,但更适合完全二叉树。

1. 堆的概念

        如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。

2. 堆的性质 

  •         逻辑上一颗完全二叉树(不需要按照链式结构进行组织,所以没有结点的概念),而是采用顺序结构进行组织。
  •         物理存储上表现为一个数组(顺序表 数字+元素个数)。

同时要求这颗完全二叉树做到:

  • 大堆——同时要求这颗完全二叉树,做到任取一个树上的元素,都大于等于其两个孩子的值。
  • 小堆——这颗完全二叉树,做到任取一个树上的元素,都小于等于其两个孩子的值。

注意:物理视角——根本没有结点存在!

3. 堆的存储方式

        堆是一颗完全二叉树,因此可以层序的规则采用顺序的方式来高效存储。

下标之间的规则:

  • 假如我们已知一个元素的下标是[k],则这个元素的左孩子的下标一定是[2 * k + 1],右孩子的下标一定是[2 * k + 2]。
  • 假如我们已知一个元素的下标是[k],则这个元素的双亲的下标一定是:[(k - 1) / 2]。

PS:如果这个元素是其双亲的左孩子那么双亲下标:[(k - 1) / 2];右孩子:[(k - 2) / 2]。但是向下取整就是((k - 1) / 2)(计算机中的除法本身就是向下取整)。

        语言表达上使用树的概念:根,左孩子,右孩子,叶子...但是实际代码层面都是下标的处理,数组的处理。

4. 堆的基本操作

(1). 向下调整/堆化操作

a. 前提

        完全二叉树基本已经满足堆的性质,只有进行操作的元素位置和其孩子的关系还不明确(也许满足,也许不满足),只有满足这个前提,才能进行向下调整操作。

要进行向下调整操作,需要:

  • 满足前提的"堆":long[] array,int size
  • 要操作的位置:int index

b. 操作(以小堆为例)

前提:"我" :待调整元素,"我" 不是叶子—>"我" 有孩子。

步骤:

1. 找到最小的孩子(可能是左孩子可能是右孩子)

2. 比较"我"和最小孩子的大小

  • "我" <= 最小的孩子 —> 满足堆的性质,调整停止
  •  "我" > 最小的孩子 —> 交换"我"和最小的孩子

3. 交换后,条件可能满足,可能不满足,若不满足,返回上述步骤,继续交换。

最坏情况:"我“是根位置,最后调整至叶子位置。

图例:

向下调整:

代码参考(小堆): 

public void shiftDown(int[] array, int parent) {
    // child先标记parent的左孩子,因为parent可能右左没有右
    int child = 2 * parent + 1;
    int size = array.length;
    while (child < size) {
        // 如果右孩子存在,找到左右孩子中较小的孩子,用child进行标记
        if(child+1 < size && array[child+1] < array[child]){
            child += 1;
        }
        // 如果双亲比其最小的孩子还小,说明该结构已经满足堆的特性了
        if (array[parent] <= array[child]) {
            break;
        }else {
            // 将双亲与较小的孩子交换
            int t = array[parent];
            array[parent] = array[child];
            array[child] = t;
            // parent中大的元素往下移动,可能会造成子树不满足堆的性质,因此需要继续向下调整
            parent = child;
            child = parent * 2 + 1;
        }
    }
}

c.复杂度

数据规模n是size:

  • 时间复杂度:完全二叉树的高度:O(log2(n))
  • 空间复杂度:非递归:O(1);递归:O(n)

(2).堆的创建

        没有任何规律的数组(完全二叉树)变成一个堆:建堆的过程。

eg:对于普通的序列{ 1,5,3,8,7,6 },该如何调整为大堆?

 

 

代码参考:

public static void createHeap(int[] array) {
    // 找倒数第一个非叶子节点,从该节点位置开始往前一直到根节点,遇到一个节点,应用向下调整
    int root = ((array.length-2)>>1);
    for (; root >= 0; root--) {
        shiftDown(array, root);
    }
}

所以构造出来的大根堆为:{8,7,6,5,1,3}。

建堆的时间复杂度:O(n)

(3).堆的插入

堆的插入总共需要两个步骤:

        1. 先将元素放入到底层空间中(注意:空间不够时需要扩容);

        2. 将最后新插入的节点向上调整,直到满足堆的性质。

图例(小堆): 

向上调整代码参考(大堆):

public void shiftUp(int child) {
    // 找到child的双亲
    int parent = (child - 1) / 2;
    while (child > 0) {
    // 如果双亲比孩子大,parent满足堆的性质,调整结束
        if (array[parent] > array[child]) {
            break;
        } else{
        // 将双亲与孩子节点进行交换
            int t = array[parent];
            array[parent] = array[child];
            array[child] = t;
            // 小的元素向下移动,可能到值子树不满足对的性质,因此需要继续向上调增
            child = parent;
            parent = (child - 1) / 1;
        }
    }
}

(4).堆的删除

注意:堆的删除一定删除的是堆顶元素。

具体如下:

        1. 将堆顶元素对堆中最后一个元素交换

        2. 将堆中有效数据个数减少一个

        3. 对堆顶元素进行向下调整

图例( 小堆):

(5). 堆最主要的应用:优先级队列(假设小堆)

a.操作

  • 插入(向上调整)
  • 删除(最后一个元素放置堆顶,向下调整)
  • 查看堆顶元素

b.代码实现

public class MyPriorityQueue {
    // 演示作用,不再考虑扩容部分的代码
    private int[] array = new int[100];
    private int size = 0;

    //插入
    public void offer(int e) {
        array[size++] = e;
        shiftUp(size - 1);
    }

    //删除
    public int poll() {
        int oldValue = array[0];
        array[0] = array[--size];
        shiftDown(0);
        return oldValue;
    }
    
    //查看堆顶元素
    public int peek() {
        return array[0];
    }
}

二、常用接口介绍

1. PriorityQueue的特性

        Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,这里主要介绍PriorityQueue。

关于PriorityQueue的使用要注意:

  • 使用时必须导入PriorityQueue所在的包,即:
import java.util.PriorityQueue;
  • PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出ClassCastException异常。
  •  不能插入null对象,否则会抛出NullPointerException。
  • 没有容量限制,可以插入任意多个元素,其内部可以自动扩容。
  • 插入和删除元素的时间复杂度为。
  • PriorityQueue底层使用了堆数据结构。
  • PriorityQueue默认情况下是小堆---即每次获取到的元素都是最小的元素。

2.PriorityQueue常用接口介绍

(1).优先级队列的构造

这里是PriorityQueue中常见的几种构造方式,具体可以查看帮助文档。

构造器功能介绍
PriorityQueue()创建一个空的优先级队列,默认容量是11
PriorityQueue(int
initialCapacity)
创建一个初始容量为initialCapacity的优先级队列,注意:
initialCapacity不能小于1,否则会抛IllegalArgumentException异
PriorityQueue(Collection<?
extends E> c)
用一个集合来创建优先级队列

        如果创建一个空的优先级队列,底层默认容量是11 ,但是一般在创建优先级队列对象时,如果知道元素个数,建议就直接将底层容量给好,否则在插入时需要不断的扩容。
        扩容机制:开辟更大的空间,拷贝元素,这样效率会比较低。

以下是JDK 1.8中,PriorityQueue的扩容方式:

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    
private void grow(int minCapacity) {
    int oldCapacity = queue.length;
    // Double size if small; else grow by 50%
    int newCapacity = oldCapacity + ((oldCapacity < 64) ?  
                      (oldCapacity + 2) :                                                                                                     
                      (oldCapacity >> 1));
    // overflow-conscious code
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    queue = Arrays.copyOf(queue, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
        MAX_ARRAY_SIZE;
}

优先级队列的扩容说明:

  • 如果容量小于64时,是按照oldCapacity的2倍方式扩容的
  • 如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
  • 如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容

注意:默认情况下,PriorityQueue队列是小堆,如果需要大堆需要用户提供比较器(实现Comparator接口,然后重写接口中的compare方法即可)。

(2).插入/删除/获取优先级最高的元素

函数名功能介绍
boolean
offer(E e)
插入元素e,插入成功返回true,如果e对象为空,抛出NullPointerException异常,时
间复杂度O(log2N) ,注意:空间不够时候会进行扩容
E peek()获取优先级最高的元素,如果优先级队列为空,返回null
E poll()移除优先级最高的元素并返回,如果优先级队列为空,返回null
int size()获取有效元素的个数
void
clear()
清空
boolean
isEmpty()
检测优先级队列是否为空,空返回true

三、堆的应用

1.PriorityQueue的实现

        用堆作为底层结构封装优先级队列。

2.堆排序

        堆排序即利用堆的思想来进行排序,总共分为两个步骤:

(1).建堆

  • 升序:建大堆
  • 降序:建小堆

(2).利用堆删除思想来进行排序

        建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序。

此外,如果想改变默认的比较方式去完成一些操作,我们可以通过实现Comparable接口或者实现Comparator接口,关于他们的具体使用可以移步:

关于对象的比较

如有建议或想法,欢迎一起讨论学习~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值