Java集合-- PriorityQueue(优先级队列)

前言

前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,出队列时可能需要优先级高的元素先出队列,该种场景下,队列就不太合适了。此时,我们的数据结构应该提供两个最基本的操作, 一是返回最高优先级对象,二是添加新的对象这种数据结构就是优先级队列(Priority Queue)。


一、优先级队列

JDK1.8 中的 PriorityQueue 底层使用了堆的数据结构,而堆实际就是在完全二叉树的基础上进行了一些元素的调整

1. 堆

1.1堆的概念:

如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)。

通俗来讲:堆中节点的值总是 小于等于 子节点的值,此堆为小堆; 堆中节点的值总是 大于等于子节点的值,此堆为大堆。

堆的示意图:

堆的性质:

  • 堆中某个节点的值总是不大于或不小于其父节点的值;
  • 堆总是一棵完全二叉树。

1.2 堆的存储方式

从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储。

注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。

将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:

  • 如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
  • 如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子
  • 如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子

1.3 堆的创建

1.3.1 堆向下调整

对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成堆呢?

仔细观察上图后发现:根节点的左右子树已经完全满足堆的性质,因此只需将根节点向下调整好即可。

向下调整过程(以小堆为例):

  1. 让parent标记需要调整的节点,child标记parent的左孩子(注意:parent如果有孩子一定先是有左孩子)

  2. 如果parent的左孩子存在,即:child < size, 进行以下操作,直到parent的左孩子不存在

    • parent右孩子是否存在,存在找到左右孩子中最小的孩子,让child进行标记

    • 将parent与较小的孩子child比较,如果:

      • parent小于较小的孩子child,调整结束
      • 否则:交换parent与较小的孩子child,交换完成之后,parent中大的元素向下移动,可能导致子树不满足对的性质,因此需要继续向下调整,即parent = child;child = parent*2+1; 然后继续步骤2

注意:在调整以parent为根的二叉树时,必须要满足parent的左子树和右子树已经是堆了才可以向下调整。

建堆代码演示:

    public int[] elem;

    public int usedSize;  //有效的数据个数

    public void createHeap(){
        for (int parent = (usedSize-1-1)/2; parent >=0 ; parent--) {
            //统一的调整方案
            shiftDown(parent,usedSize);
        }
    }
    /*
    * parent: 每颗子树的根结点下标
    * len: 每颗子树调整的结束位置 不能大于len
    *
    * */
    private void shiftDown(int parent,int len){
        int child=parent*2+1;
        //1.必须保证有左孩子
        while (child<len){
            // child+1<len  保证有右孩子
            if (child+1<len && elem[child]<elem[child+1]){
                child++;
            }
            //child下标,一定是左右孩子最大值的下标
            if (elem[child]>elem[parent]){
                int tmp=elem[child];
                elem[child]=elem[parent];
                elem[parent]=tmp;
                //交换完之后,往下走一个子树继续判断
                parent=child;
                child=parent*2+1;
            }else {
                break;   //此树如果不需要调整,跳出循环
            }
        }
    }

1.4 堆的插入和删除

1.4.1 堆的插入

堆得插入需要两个步骤:

  1. 先将元素放入到底层空间中(注意:空间不够时需要扩容)
  2. 将最后新插入的节点向上调整,直到满足堆的性质

代码演示:

    public void offer(int val){   //插入元素
        if (isFull()){
            //扩容
            this.elem= Arrays.copyOf(this.elem,this.elem.length*2);
        }
        this.elem[usedSize]=val;
        usedSize++;
        //此时不为大根堆,  使其变为大根堆
        shiftUp(usedSize-1);
    }

    private void shiftUp(int child){
        //找到child的双亲
        int parent=(child-1)/2;
        while (child>0){
            //如果孩子比双亲大,进行调整
            if (elem[child]>elem[parent]){
                int tmp=elem[child];
                elem[child]=elem[parent];
                elem[parent]=tmp;
                child=parent;
                parent=(child-1)/2;
            }else {
                break;
            }
        }
    }
1.4.1 堆的删除

注意:堆的删除一定删除的是堆顶元素。具体如下:

  1. 将堆顶元素对堆中最后一个元素交换
  2. 将堆中有效数据个数减少一个
  3. 对堆顶元素进行向下调整
    public int pop(){  //删除堆顶元素
        if (isEmpty()){
            return-1;
        }

        int tmp=elem[0];
        elem[0]=elem[usedSize-1];
        elem[usedSize-1]=tmp;
        usedSize--;
        //删除后要保证仍然是一个大根堆
        shiftDown(0,usedSize);
        return tmp;
    }
    private void shiftDown(int parent,int len){
        int child=parent*2+1;
        //1.必须保证有左孩子
        while (child<len){
            // child+1<len  保证有右孩子
            if (child+1<len && elem[child]<elem[child+1]){
                child++;
            }
            //child下标,一定是左右孩子最大值的下标
            if (elem[child]>elem[parent]){
                int tmp=elem[child];
                elem[child]=elem[parent];
                elem[parent]=tmp;
                //交换完之后,往下走一个子树继续判断
                parent=child;
                child=parent*2+1;
            }else {
                break;   //此树如果不需要调整,跳出循环
            }
        }
    }

1.5 堆的应用

1.5.1 PriorityQueue 的实现

用堆作为底层结构封装优先级队列

1.5.2 堆排序

堆排序即利用堆的思想来进行排序,总共分为两个步骤:

  1. 建堆
    • 升序:建大堆
    • 降序:建小堆
  2. 利用堆删除思想来进行排序

建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序

2. PriorityQueue

2.1 PriorityQueue特性

Java集合框架中提供了 PriorityQueuePriorityBlockingQueue 两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,本文主要介绍PriorityQueue。

  1. 使用时必须导入PriorityQueue所在的包
  2. PriorityQueue中 放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出
    ClassCastException异常
  3. 不能插入null对象,否则会抛出NullPointerException
  4. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
  5. 插入和删除元素的时间复杂度为 O(log2^N)
  6. PriorityQueue 底层使用了堆数据结构
  7. PriorityQueue默认情况下是小堆—即每次获取到的元素都是最小的元素

2.2 PriorityQueue 常用接口介绍

2.2.1 优先级队列的构造
构造器功能
PriorityQueue()创建一个空的优先级队列,默认容量是11
PriorityQueue(intinitialCapacity)创建一个初始容量为initialCapacity的优先级队列,注意:initialCapacity不能小于1,否则会抛IllegalArgumentException异常
PriorityQueue(Collection<? extends E> c)用一个集合来创建优先级队列

代码示例:

		static void TestPriorityQueue(){
		// 创建一个空的优先级队列,底层默认容量是11
		PriorityQueue<Integer> q1 = new PriorityQueue<>();
		// 创建一个空的优先级队列,底层的容量为initialCapacity
		PriorityQueue<Integer> q2 = new PriorityQueue<>(100);
		ArrayList<Integer> list = new ArrayList<>();
		list.add(4);
		list.add(3);
		list.add(2);
		list.add(1);
		// 用ArrayList对象来构造一个优先级队列的对象
		// q3中已经包含了三个元素
		PriorityQueue<Integer> q3 = new PriorityQueue<>(list);
		System.out.println(q3.size());
		System.out.println(q3.peek());
}

注意:默认情况下,PriorityQueue队列是小堆,如果需要大堆需要用户提供比较器

		// 用户自己定义的比较器:直接实现Comparator接口,然后重写该接口中的compare方法即可
class IntCmp implements Comparator<Integer>{
	@Override
	public int compare(Integer o1, Integer o2) {
		return o2-o1;
	}
}
public class TestPriorityQueue {
	public static void main(String[] args) {
		PriorityQueue<Integer> p = new PriorityQueue<>(new IntCmp());
		p.offer(4);
		p.offer(3);
		p.offer(2);
		p.offer(1);
		p.offer(5);
		System.out.println(p.peek());
	}
}

此时再创建出来的就是大堆。

2.2.2 插入/删除/获取优先级最高的元素
函数名功能
boolean offer(E e)插入元素e,插入成功返回true,如果e对象为空,抛出NullPointerException异常,时间复杂度 ,注意:空间不够时候会进行扩容
E peek()获取优先级最高的元素,如果优先级队列为空,返回null
E poll()移除优先级最高的元素并返回,如果优先级队列为空,返回null
int size()获取有效元素的个数
void clear()清空
boolean isEmpty()检测优先级队列是否为空

以下是JDK 1.8中,PriorityQueue 的扩容方式:

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

private void grow(int minCapacity) {
	int oldCapacity = queue.length;
	// Double size if small; else grow by 50%
	int newCapacity = oldCapacity + ((oldCapacity < 64) ?
						(oldCapacity + 2) :
						(oldCapacity >> 1));
	// overflow-conscious code
	if (newCapacity - MAX_ARRAY_SIZE > 0)
		newCapacity = hugeCapacity(minCapacity);
	queue = Arrays.copyOf(queue, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
	if (minCapacity < 0) // overflow
		throw new OutOfMemoryError();
	return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;
}

优先级队列的扩容说明:

  • 如果容量小于64时,是按照oldCapacity的2倍方式扩容的
  • 如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
  • 如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容

2.2 优先级队列的应用

top-k 问题

最大或者最小的前k个数据 , 一般情况下数据量都特别大,比如世界500强、富豪榜、游戏中前100个玩家等等。

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下

  1. 用数据集合中前K个元素来建堆
    • 前k个最大的元素,则建小堆
    • 前k个最小的元素,则建大堆
  2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值