文章目录
前言
前几篇博客我们学习了二叉树,并且带大家做了几道oj题,下面我们学习一个新的数据结构—优先级队列(堆)。
1.优先级队列
前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话;初中那会班主任排座位时可能会让成绩好的同学先挑座位。
在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
2.优先级的模拟实现
PriorityQueue底层使用了堆这种数据结构,而堆实际就是在完全二叉树的基础上进行了一些调整。
2.1.堆的概念
如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
堆的性质:
- 堆中某个节点的值总是不大于或不小于其父节点的值;
- 堆总是一棵完全二叉树。
2.2 堆的存储方式
从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储,
注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。
将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:
- 如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
- 如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子
- 如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子
2.3.堆的创建
2.3.1.堆向下调整
对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成堆呢?
public class TestHeap {
public int[] elem;
public int usedSize;
public TestHeap(){
this.elem = new int[10];
}
public void initElem(int[] array){
for (int i = 0; i < array.length; i++) {
this.elem[i] = array[i];
this.usedSize++;
}
}
public void createHeap(){
for (int parent = (this.usedSize-1-1)/2;parent>=0;parent--){
shiftDown(parent,usedSize);
}
}
private void shiftDown(int parent, int usedSize) {
int child = 2 * parent + 1;
while (child < usedSize){
//左右孩子都存在,并且左节点的值 小于 父亲结点的值
if (child + 1 <usedSize && elem[child] < elem[child + 1]){
child ++;
}
if (elem[parent] < elem[child]){
swap(elem,parent,child);
parent = child;
child = 2 * parent + 1;
}else {
break;
}
}
}
private void swap(int[] elem, int parent, int child) {
int tmp = elem[parent];
elem[parent] = elem[child];
elem[child] = tmp;
}
}
下来我们分析一下,向下调整和建堆的时间复杂度?
向下调整:
从根一路比较到叶子,比较的次数为完全二叉树的高度,即时间复杂度为O(logn)。
建堆:
建堆的时间时间复杂度:O(logn)
2.3.2.堆的插入
堆的插入总共需要两个步骤:
- 先将元素放入到底层空间中(注意:空间不够时需要扩容)
- 将最后新插入的节点向上调整,直到满足堆的性质
public void offer(int val){
if (isFull()){
this.elem = Arrays.copyOf(this.elem,2*this.elem.length);
}
elem[usedSize] = val;
shiftUp(usedSize);
usedSize++;
}
private void shiftUp(int child) {
int parent = (child - 1)/2;
while (parent>=0){
if (elem[parent] < elem[child]){
swap(elem,parent,child);
child = parent;
parent = (child-1)/2;
}else {
break;
}
}
}
public boolean isFull(){
return this.usedSize == this.elem.length;
}
2.3.3.堆的删除
注意:堆的删除一定删除的是堆顶元素。具体如下:
- 将堆顶元素对堆中最后一个元素交换
- 将堆中有效数据个数减少一个
- 对堆顶元素进行向下调整
public int peek(){
if (isEmpty()){
return -1;
}
return elem[0];
}
public int poll(){
if (isEmpty()){
return -1;
}
int val = elem[0];
swap(elem,0,usedSize-1);
shiftDown(0,usedSize-1);
usedSize--;
return val;
}
3.常见的接口介绍
3.1 PriorityQueue的特性
Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,本文主要介绍PriorityQueue。
关于PriorityQueue的使用要注意:
1.PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出ClassCastException异常
2. 不能插入null对象,否则会抛出NullPointerException
3. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
4. 插入和删除元素的时间复杂度为
5. PriorityQueue底层使用了堆数据结构
6. PriorityQueue默认情况下是小堆—即每次获取到的元素都是最小的元素
3.2 PriorityQueue常用接口介绍
- 优先级队列的构造
此处只是列出了PriorityQueue中常见的几种构造方式,其他的学生们可以参考帮助文档。
注意:默认情况下,PriorityQueue队列是小堆,如果需要大堆需要用户提供比较器。
class IntCmp implements Comparator<Integer>{
@Override
public int compare(Integer o1, Integer o2) {
return o2.compareTo(o1);
}
}
public static void main(String[] args) {
PriorityQueue<Integer> priorityQueue= new PriorityQueue<>(new IntCmp());
priorityQueue.offer(10);
priorityQueue.offer(12);
priorityQueue.offer(5);
System.out.println(priorityQueue.peek());
}
这就变成了一个大根堆
上述的操作,大家可以以自己去练习练习。
注意:以下是JDK 1.8中,PriorityQueue的扩容方式:
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
int oldCapacity = queue.length;
// Double size if small; else grow by 50%
int newCapacity = oldCapacity + ((oldCapacity < 64) ?
(oldCapacity + 2) :
(oldCapacity >> 1));
// overflow-conscious code
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
queue = Arrays.copyOf(queue, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
优先级队列的扩容说明:
- 如果容量小于64时,是按照oldCapacity的2倍方式扩容的
- 如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
- 如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容。
3.3.OJ题的练习
top-k问题:最大或者最小的前k个数据。比如:世界前500强公司
最小K个数
方法2:
public int[] smallestK(int[] arr, int k) {
PriorityQueue<Integer> queue = new PriorityQueue();
for (int i = 0 ;i<arr.length;i++){
queue.offer(arr[i]);
}
int[] ret = new int[k];
for (int i = 0;i<k;i++){
ret[i] = queue.poll();
}
return ret;
}
方案三:
class Solution {
static class IntCmp implements Comparator<Integer> {
@Override
public int compare(Integer o1, Integer o2) {
return o2.compareTo(o1);
}
}
public int[] smallestK(int[] arr, int k) {
int[] ret = new int[k];
if (arr == null || k == 0) {
return ret;
}
PriorityQueue<Integer> queue = new PriorityQueue(k,new IntCmp());
for (int i = 0; i < k; i++) {
queue.offer(arr[i]);
}
for (int i = k; i < arr.length; i++) {
int peekVal = queue.peek();
if (peekVal > arr[i]) {
queue.poll();
queue.offer(arr[i]);
}
}
for (int i = 0; i < k; i++) {
ret[i] = queue.poll();
}
return ret;
}
}
完