PriorityQueue(优先级队列<--堆)

目录

前言 

1.概念 

2.优先级队列的模拟实现 

2.1 堆的概念

2.2 堆的存储方式 

2.3 堆的创建 

2.4 堆的插入和删除 

3. PriorityQueue的相关介绍 

3.1 PriorityQueue的特性 

3.2 优先级队列的构造 

PriorityQueue的实现 

Top-k问题


​​​​​​​

前言 

本篇博客介绍关于PriorityQueue即优先级队列---堆的相关知识,旨在帮助大家理解优先级队列,即堆的深层含义,对于数据结构的进一步理解提供了思路……

1.概念 

这里补充一下队列的相关知识,队列是一种先进先出(FIFO)的数据结构 。

但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该中场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话;初中那会班主任排座位时可能会让成绩好的同学先挑座位。

在这种情况下,数据结构应该提供两个最基本的操作一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue,)。

2.优先级队列的模拟实现 

JDK1.8中的PriorityQueue底层使用了堆这种数据结构

而堆实际就是在完全二叉树的基础上进行了一些调整。 

2.1 堆的概念

如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一 个一维数组中,并满足:Ki 且 Ki= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆

堆的性质: 

  • 堆中某个节点的值总是不大于或不小于其父节点的值;
  • 堆总是一棵完全二叉树。 

小根堆&&大根堆图示理解如下: 

2.2 堆的存储方式 

从上面我们可以知道:堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储, 

对于非完全二叉树,则不适合使用顺序方式进行存储,这里为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。将元素存储到数组中后,我们假设i为节点在数组中的下标,则可以得到:

  • 如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
  • 如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子
  • 如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子

2.3 堆的创建 

  • 堆的向下调整 

 向下过程(以小堆为例):

1. 让parent标记需要调整的节点,child标记parent的左孩子(注意:parent如果有孩子一定先是有左孩子)

2. 如果parent的左孩子存在,即:child < size, 进行以下操作,直到parent的左孩子不存在

  • parent右孩子是否存在,存在找到左右孩子中最小的孩子,让child进行比较 
  • 将parent与较小的孩子child比较

        如果:

  •      parent小于较小的孩子child,调整结束
  •      否则:交换parent与较小的孩子child,交换完成之后,parent中大的元素向下移动,可能导致子树不满足对的性质,因此需要继续向下调整,即parent = child;child = parent*2+1; 然后继续2。这里给大家提供一个例子:

  • 代码思想: 
public void shiftDown(int[] array, int parent) {
    // child先标记parent的左孩子,因为parent可能右左没有右
    int child = 2 * parent + 1;
    int size = array.length;
    
    while (child < size) {
        
        // 如果右孩子存在,找到左右孩子中较小的孩子,用child进行标记
        if(child+1 < size && array[child+1] < array[child]){
        child += 1;
       }
        
        // 如果双亲比其最小的孩子还小,说明该结构已经满足堆的特性了
        if (array[parent] <= array[child]) {
            break;
       }else{
            // 将双亲与较小的孩子交换
       int t = array[parent];
       array[parent] = array[child];
       array[child] = t;
            
            // parent中大的元素往下移动,可能会造成子树不满足堆的性质,因此需要继续向下调整
            parent = child;
            child = parent * 2 + 1;
       }
   }
}

注意:在调整以parent为根的二叉树时,必须要满足parent的左子树和右子树已经是堆了才可以向下调整时间复杂度分析: 最坏的情况即图示的情况,从根一路比较到叶子,比较的次数为完全二叉树的高度,即时间复杂度为O(log2n)。

那么当根节点的左右子树不满足堆的特性,又该如何调整呢? 

提供如下代码参考: 

public static void createHeap(int[] array) {
    // 找倒数第一个非叶子节点,从该节点位置开始往前一直到根节点,遇到一个节点,应用向下调整
    int root = ((array.length-2)>>1);
    for (; root >= 0; root--) {
        shiftDown(array, root);
   }
}
  • 建堆的时间复杂度 

因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是 近似值,多几个节点不影响最终结果):最终看如下推导过程:

所以,建堆的时间复杂度为O(N)。  

2.4 堆的插入和删除 

  • 堆的插入

总共需要两个步骤:

              1. 先将元素放入到底层空间中(注意:空间不够时需要扩容)

              2. 将最后新插入的节点向上调整,直到满足堆的性质 

这里给大家提供图示帮助理解:

  • 参考代码: 
public void shiftUp(int child) {
    // 找到child的双亲
     int parent = (child - 1) / 2;
    
    while (child > 0) {
        // 如果双亲比孩子大,parent满足堆的性质,调整结束
        if (array[parent] > array[child]) {
            break;
       }
        else{
            // 将双亲与孩子节点进行交换 
            int t = array[parent];
            array[parent] = array[child];
            array[child] = t;
        
            // 小的元素向下移动,可能到值子树不满足对的性质,因此需要继续向上调增
            child = parent;
            parent = (child - 1) / 1;
       }
   }
}
  • 堆的删除 

注意:堆的删除一定删除的是堆顶元素。

具体如下: 1. 将堆顶元素对堆中最后一个元素交换

                   2. 将堆中有效数据个数减少一个

                   3. 对堆顶元素进行向下调整  

图示理解如下: 

这里用堆模拟实现一下优先级队列

public class MyPriorityQueue {
    // 演示作用,不再考虑扩容部分的代码
    private int[] array = new int[100];
    private int size = 0;
    
    public void offer(int e) {
        array[size++] = e;
        shiftUp(size - 1);
   }
    
    public int poll() {
        int oldValue = array[0];
        array[0] = array[--size];
        shiftDown(0);
        return oldValue;
   }
    
    public int peek() {
        return array[0];
   }
}

3. PriorityQueue的相关介绍 

3.1 PriorityQueue的特性 

java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的.

这里我们主要了解PriorityQueue,如下图所示: 

关于PriorityQueue的使用要注意:

1. 使用时必须导入PriorityQueue所在的包,即:  

import java.util.PriorityQueue;

2. PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出 ClassCastException异常

3. 不能插入null对象,否则会抛出NullPointerException

4. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容

5. 插入和删除元素的时间复杂度为

6. PriorityQueue底层使用了堆数据结构 7. PriorityQueue默认情况下是小堆---即每次获取到的元素都是最小的元素  

3.2 优先级队列的构造 

参考代码:

static void TestPriorityQueue(){
        // 创建一个空的优先级队列,底层默认容量是11
        PriorityQueue<Integer> q1 = new PriorityQueue<>();
 
        // 创建一个空的优先级队列,底层的容量为initialCapacity
        PriorityQueue<Integer> q2 = new PriorityQueue<>(100);
 
        ArrayList<Integer> list = new ArrayList<>();
        list.add(4);
        list.add(3);
        list.add(2);
        list.add(1);
 
        // 用ArrayList对象来构造一个优先级队列的对象
        // q3中已经包含了三个元素
        PriorityQueue<Integer> q3 = new PriorityQueue<>(list);
        System.out.println(q3.size());
        System.out.println(q3.peek());
   }

这里需要注意的是:默认情况下,PriorityQueue队列是小堆,如果需要大堆需要用户提供比较器,此时创建的就是大堆。 

// 用户自己定义的比较器:直接实现Comparator接口,然后重写该接口中的compare方法即可
class IntCmp implements Comparator<Integer>{
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2-o1;
   }
}
 
public class TestPriorityQueue {
    public static void main(String[] args) {
        PriorityQueue<Integer> p = new PriorityQueue<>(new IntCmp());
        p.offer(4);
        p.offer(3);
        p.offer(2);
        p.offer(1);
        p.offer(5);
        System.out.println(p.peek());
   }
}
  • 插入/删除/获取优先级最高的元素  

static void TestPriorityQueue2(){
    int[] arr = {4,1,9,2,8,0,7,3,6,5};
 
    // 一般在创建优先级队列对象时,如果知道元素个数,建议就直接将底层容量给好
    // 否则在插入时需要不多的扩容
    // 扩容机制:开辟更大的空间,拷贝元素,这样效率会比较低
    PriorityQueue<Integer> q = new PriorityQueue<>(arr.length);
    for (int e: arr) {
        q.offer(e);
   }
 
    System.out.println(q.size());   // 打印优先级队列中有效元素个数
    System.out.println(q.peek());   // 获取优先级最高的元素
 
    // 从优先级队列中删除两个元素之和,再次获取优先级最高的元素
    q.poll();
    q.poll();
    System.out.println(q.size());   // 打印优先级队列中有效元素个数
    System.out.println(q.peek());   // 获取优先级最高的元素
 
    q.offer(0);
    System.out.println(q.peek());   // 获取优先级最高的元素
 
    // 将优先级队列中的有效元素删除掉,检测其是否为空
    q.clear();
    if(q.isEmpty()){
        System.out.println("优先级队列已经为空!!!");
        }
        else{
            System.out.println("优先级队列不为空");
}        
}
  • PriorityQueue的扩容方式

JDK1.8版本: 

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
int oldCapacity = queue.length;
// Double size if small; else grow by 50%
int newCapacity = oldCapacity + ((oldCapacity < 64) ?
(oldCapacity + 2) :
(oldCapacity >> 1));
// overflow-conscious code
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
queue = Arrays.copyOf(queue, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
优先级队列的扩容说明
  • 如果容量小于64时,是按照oldCapacity2倍方式扩容的
  • 如果容量大于等于64,是按照oldCapacity1.5倍方式扩容的
  • 如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容
  • PriorityQueue的实现 

堆作为底层结构封装优先级队列   

  • 堆排序  

两个步骤:

                1. 建堆   升序:建大堆

                              降序:建小堆

                2. 利用堆删除思想来进行排序  

这里给大家介绍一下Top-k问题 。

  • Top-k问题

TOP-K问题:即求数据集合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大

比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都 不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,

基本思路如下:

1. 用数据集合中前K个元素来建堆

  • 前k个最大的元素,则建小堆
  • 前k个最小的元素,则建大堆

2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。  

这里给出关于Top-k问题解决的详细代码,供大家参考:

//使用比较器创建小根堆
class LessIntComp implements Comparator<Integer>{
@Override
public int compare(Integer o1, Integer o2) {
return o1 - o2;
}
}
//使用比较器创建大根堆
class GreaterIntComp implements Comparator<Integer>{
@Override
public int compare(Integer o1, Integer o2) {
return o2 - o1;
}
}
public class TestDemo<E> {
//求最小的K个数,通过比较器创建大根堆
public static int[] smallestK(int[] array, int k) {
if(k <= 0) {
return new int[k];
}
GreaterIntComp greaterCmp = new GreaterIntComp();
PriorityQueue<Integer> maxHeap = new PriorityQueue<>(greaterCmp);
//先将前K个元素,创建大根堆
for(int i = 0; i < k; i++) {
maxHeap.offer(array[i]);
}
//从第K+1个元素开始,每次和堆顶元素比较
for (int i = k; i < array.length; i++) {
int top = maxHeap.peek();
if(array[i] < top) {
maxHeap.poll();
maxHeap.offer(array[i]);
}
}
//取出前K个
int[] ret = new int[k];
for (int i = 0; i < k; i++) {
int val = maxHeap.poll();
ret[i] = val;
}
return ret;
}
public static void main(String[] args) {
int[] array = {4,1,9,2,8,0,7,3,6,5};
int[] ret = smallestK(array,3);
System.out.println(Arrays.toString(ret));
}
}

 

 

 

 

  • 30
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱编程的Tom

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值