优先级队列
概念
前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该中场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话。
在这种情况下,我们的数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
优先级队列的模拟实现
JDK1.8中的PriorityQueue 底层使用了堆的数据结构,而堆实际就是在完全二叉树的基础之上进行了一些元素的调整
堆的概念
如果有一个关键码的集合K = {k0**,k1,** k2**,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中**,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)。
根节点最大的堆叫做最大堆或大根堆
根节点最小的堆叫做最小堆或小根堆
堆的性质
-
堆中某个结点的值总是不大于或不小于其父节点的值
-
堆总是一颗完全二叉树
堆的存储方式
从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储
注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低
将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:
- 如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
- 如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子
- **如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子 **
堆的创建
堆向下调整
对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成堆呢 ?
仔细观察上图后发现:根节点的左右子树已经完全满足堆的性质,因此只需将根节点向下调整好即可
向下过程(以小堆为例):
- 让parent标记需要调整的节点,child标记parent的左孩子(注意:parent如果有孩子一定先是有左孩子)
- 如果parent的左孩子存在,即:child < size, 进行以下操作,直到parent的左孩子不存在
- parent右孩子是否存在,存在找到左右孩子中最小的孩子,让child进行标记
- 将parent与较小的孩子child比较,如果:
- parent小于较小的孩子child,调整结束
- 否则:交换parent与较小的孩子child,交换完成之后,parent中大的元素向下移动,可能导致子树不满足对的性质,因此需要继续向下调整,即parent = child;child = parent*2+1; 然后继续2。
public class Heap {
public int[] elem;
private int usedSize;
public Heap(){
this.elem = new int[]{27,15,19,18,28,34,65,49,25,37};
this.usedSize = this.elem.length;
}
}
private void swap(int index1,int index2){
int tmp = elem[index1];
elem[index1] = elem[index2];
elem[index2] = tmp;
}
/**
* 向下调整 通过父结点 得 孩子结点
* @param parent 父节点
* @param len 堆大小
*/
private void shiftDown(int parent,int len){
int child = parent*2+1;
while(child < len){
//右孩子存在,且找出较小的孩子
if(child + 1<len && elem[child] > elem[child+1]){
child++;
}
//孩子与parent比较 建小堆(孩子小于父亲,交换)
if(elem[child] < elem[parent]){
swap(child,parent);
parent = child;
child = parent*2+1;
}else{
break;
}
}
}
注意:在调整以parent为根的二叉树时,必须要满足parent的左子树和右子树已经是堆了才可以向下调整。
时间复杂度分析:
最坏的情况即图示的情况,从根一路比较到叶子,比较的次数为完全二叉树的高度,即时间复杂度为
堆的创建
那对于普通的序列{ 1,5,3,8,7,6 },即根节点的左右子树不满足堆的特性,又该如何调整呢 ?
从尾结点开始逐个向下调整(即保证每一个子树都是堆)
public void createHeap(){
//从尾结点开始向下调整
for (int i = this.usedSize-1; i >=0; i--) {
shiftDown(i,this.usedSize);
}
}
建堆的时间复杂度
因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果)
建堆的时间复杂度为O(N)
堆的插入与删除
堆的插入
堆的插入总共需要两个步骤:
- 先将元素放在底层空间中(注意:空间不足时,空间扩容)
- 最后新插入的数据进行向上调整,直至满足堆的性质
向上调整
通过孩子 找到父亲 作比较 向上调整,直至满足堆的性质
/**
* 默认 小堆
* 向上调整 通过孩子 求父结点 调整
* @param child 孩子
*/
private void shiftUp(int child){
int parent = (child-1)/2;
while (parent >= 0){
if(child >0 && this.elem[parent] > this.elem[child]){
swap(child,parent);
child = parent;
parent = (child-1)/2;
}else{
break;
}
}
}
插入
private boolean isFull(){
return this.elem.length == this.usedSize;
}
public void push(int val){
if(isFull()){
this.elem = Arrays.copyOf(this.elem,this.usedSize*2);
}
//置尾,尾结点向上调整
this.elem[this.usedSize] = val;
shiftUp(this.usedSize);
this.usedSize++;
}
堆的删除
注意:堆的删除一定删除的是堆顶元素。(优先级队列,堆顶优先级最高)
堆的删除步骤:
- 将堆顶元素对堆中的最后一个元素交换
- 将堆中有效数据个数减少一个
- 对堆顶元素进行向下调整
public boolean isEmpty(){
return this.usedSize == 0;
}
public int pol(){
if(isEmpty()){
throw new RuntimeException("堆为空!");
}
int del = this.elem[0];
//删除 即将堆顶换置堆尾 usedSize-1
swap(0,this.usedSize-1);
this.usedSize--;
//复原堆,堆顶向下调整
shiftDown(0,this.usedSize);
return del;
}
堆排序(先导)
排升序,建大堆;排降序,建小堆;
升序为例
{67, 37, 49, 34, 27, 19, 28, 25, 15, 18}
建小堆,排序 时间复杂度为O(N*2)
建大堆,排序 时间复杂度 O(log(N))
TopK问题
返回一组数据的前K个最大(最小)个数据
堆的应用TopK问题
返回堆的前K个最小(最大)数据
前K个最小: 建大堆(数据个数为K),其余数据与堆顶数据比较,小则替换堆顶数据
原理:假设前K个数据已为最小,若比 前K个数据中最大的数据要小,则为前K个数据之一。
前K个数据为大堆,堆顶为前K个中最大的数
其余数据逐个比较,小则替换堆顶数据,调整为大堆
此时,堆顶认为前K个中的最大数
直至该组数据结束,前K个数为该组数据中最小的前K个数据
**前K个最大:**建小堆
同理得 假设前K个数据已为最大,若比 前K个数据中最小的数据要大,则为前K个数据之一。
/**
* topk问题 返回最小的前k个数据
* @param k 返回的数据个数
* @return 最小的前k个数据
*/
public int[] topK(int k){
if(isEmpty()){
throw new RuntimeException("堆为空!");
}
//构建大小为k的堆
int[] topk = Arrays.copyOf(this.elem,k);
//逐个比较,处理
for(int i = k;i<this.usedSize;i++){
if(this.elem[i] > topk[0]){
topk[0] = this.elem[i];
shiftDown(topk,0,k);
}
}
return topk;
}
常用接口介绍
PriorityQueue的特性
Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的, PriorityBlockingQueue是线程安全的,本文主要介绍PriorityQueue
关于PriorityQueue的使用要注意:
- 使用必须导入PriorityQueue所在的包,即:
import java.util.PriorityQueue;
- PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出classCastException异常
- 不能插入null对象,否则会抛出NullPointerException
- 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
- 插入和删除元素的时间复杂度为
- PriorityQueue底层使用了堆数据结构, (注意:此处大家可以不用管什么是堆,后文中有介绍)
- PriorityQueue默认情况下是小堆—即每次获取到的元素都是最小的元素
PriorityQueue常用接口介绍
优先级队列的构造
此处只是列出了PriorityQueue中常见的几种构造方式,其他的学生们可以参考帮助文档
构造器 | 功能介绍 |
---|---|
PriorityQueue() | 创建一个空的优先级队列,默认容量是11 |
PriorityQueue(int initialCapacity) | 创建一个初始容量为initialCapacity的优先级队列,注意: initialCapacity不能小于1,否则会抛IllegalArgumentException异 常 |
PriorityQueue(Collection<? extends E> c) | 用一个集合来创建优先级队列 |
static void TestPriorityQueue(){
// 创建一个空的优先级队列,底层默认容量是11
PriorityQueue<Integer> q1 = new PriorityQueue<>();
// 创建一个空的优先级队列,底层的容量为initialCapacity
PriorityQueue<Integer> q2 = new PriorityQueue<>(100);
ArrayList<Integer> list = new ArrayList<>();
list.add(4);
list.add(3);
list.add(2);
list.add(1);
// 用ArrayList对象来构造一个优先级队列的对象
// q3中已经包含了三个元素
PriorityQueue<Integer> q3 = new PriorityQueue<>(list);
System.out.println(q3.size());
System.out.println(q3.peek());
}
注意:默认情况下,PriorityQueue队列是小堆,如果需要大堆需要用户提供比较器
// 用户自己定义的比较器:直接实现Comparator接口,然后重写该接口中的compare方法即可
//1.
class Student implements Comparable<Student>{
public String name;
public int age;
public Student(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public String toString() {
return "Student{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
@Override
public int compareTo(Student o) {
return this.age-o.age;
//return o.age-this.age;
}
}
//2.
class Student {
public String name;
public int age;
public Student(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public String toString() {
return "Student{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
}
class AgeComparator implements Comparator<Student>{
@Override
public int compare(Student o1, Student o2) {
return o2.age-o1.age;
}
}
// 用户自己定义的比较器:直接实现Comparator接口,然后重写该接口中的compare方法即可
public static void main4(String[] args) {
AgeComparator ageComparator = new AgeComparator();
PriorityQueue<Student> students = new PriorityQueue<>(ageComparator);
//1.PriorityQueue<Student> students = new PriorityQueue<>();
students.offer(new Student("bit",19));
students.offer(new Student("gaobo",9));
System.out.println(students);
}
观察源码可得实现原理
插入/删除/获取优先级最高的元素
函数名 | 功能介绍 |
---|---|
boolean offer(E e) | 插入元素e,插入成功返回true,如果e对象为空,抛出NullPointerException异常,时间复杂度[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WSMb4OTw-1649167805282)(图片/image-20220325173931075.png)] ,注意:空间不够时候会进行扩容 (每放一个数据就会,进行比较向上调整,放入的数据必须是可比较的即有比较器) |
E peek() | 获取优先级最高的元素,如果优先级队列为空,返回null |
E poll() | 移除优先级最高的元素并返回,如果优先级队列为空,返回null |
int size() | 获取有效元素的个数 |
void clear() | 清空 |
boolean isEmpty() | 检测优先级队列是否为空,空返回true |
注意:以下是JDK 1.8中,PriorityQueue的扩容方式:
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
int oldCapacity = queue.length;
// Double size if small; else grow by 50%
int newCapacity = oldCapacity + ((oldCapacity < 64) ?
(oldCapacity + 2) :
(oldCapacity >> 1));
// overflow-conscious code
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
queue = Arrays.copyOf(queue, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE :MAX_ARRAY_SIZE;
}
优先级队列的扩容说明:
- 如果容量小于64时,是按照oldCapacity的2倍方式扩容的
- 如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
- 如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容
优先级队列的应用
top-k问题:最大或者最小的前k个数据
class Solution {
public int[] smallestK(int[] arr, int k) {
// 参数检测
if(null == arr || k <= 0)
return new int[0];
PriorityQueue<Integer> q = new PriorityQueue<>(arr.length);
// 将数组中的元素依次放到堆中
for(int i = 0; i < arr.length; ++i){
q.offer(arr[i]);
}
// 将优先级队列的前k个元素放到数组中
int[] ret = new int[k];
for(int i = 0; i < k; ++i){
ret[i] = q.poll();
}
return ret;
}
}
最难不过坚持!