数据结构_优先队列

最新推荐文章于 2024-08-05 09:40:25 发布

HCH996

最新推荐文章于 2024-08-05 09:40:25 发布

阅读量605

点赞数

分类专栏： leetcode刷题

本文链接：https://blog.csdn.net/weixin_37841366/article/details/108696271

版权

leetcode刷题专栏收录该内容

11 篇文章 0 订阅

订阅专栏

优先队列（Priority Queue）
特点
能保证每次取出的元素都是队列中优先级别最高的。优先级别可以是自定义的，例如，数据的数值越大，优先级越高；或者数据的数值越小，优先级越高。优先级别甚至可以通过各种复杂的计算得到。

应用场景
从一堆杂乱无章的数据当中按照一定的顺序（或者优先级）逐步地筛选出部分乃至全部的数据。

举例：任意一个数组，找出前 k 大的数。

解法 1：先对这个数组进行排序，然后依次输出前 k 大的数，复杂度将会是 O(nlogn)，其中，n 是数组的元素个数。这是一种直接的办法。

解法 2：使用优先队列，复杂度优化成 O(k + nlogk)。

当数据量很大（即 n 很大），而 k 相对较小的时候，显然，利用优先队列能有效地降低算法复杂度。因为要找出前 k 大的数，并不需要对所有的数进行排序。

实现
优先队列的本质是一个二叉堆结构。堆在英文里叫 Binary Heap，它是利用一个数组结构来实现的完全二叉树。换句话说，优先队列的本质是一个数组，数组里的每个元素既有可能是其他元素的父节点，也有可能是其他元素的子节点，而且，每个父节点只能有两个子节点，很像一棵二叉树的结构。

牢记下面优先队列有三个重要的性质。

1. 数组里的第一个元素 array[0] 拥有最高的优先级别。

2. 给定一个下标 i，那么对于元素 array[i] 而言：

它的父节点所对应的元素下标是 (i-1)/2
它的左孩子所对应的元素下标是 2×i + 1
它的右孩子所对应的元素下标是 2×i + 2

3. 数组里每个元素的优先级别都要高于它两个孩子的优先级别。

优先队列最基本的操作有两个。

1. 向上筛选（sift up / bubble up）

当有新的数据加入到优先队列中，新的数据首先被放置在二叉堆的底部。

不断进行向上筛选的操作，即如果发现该数据的优先级别比父节点的优先级别还要高，那么就和父节点的元素相互交换，再接着往上进行比较，直到无法再继续交换为止。

时间复杂度：由于二叉堆是一棵完全二叉树，并假设堆的大小为 k，因此整个过程其实就是沿着树的高度往上爬，所以只需要 O(logk) 的时间。

2. 向下筛选（sift down / bubble down）

当堆顶的元素被取出时，要更新堆顶的元素来作为下一次按照优先级顺序被取出的对象，需要将堆底部的元素放置到堆顶，然后不断地对它执行向下筛选的操作。
将该元素和它的两个孩子节点对比优先级，如果优先级最高的是其中一个孩子，就将该元素和那个孩子进行交换，然后反复进行下去，直到无法继续交换为止。

时间复杂度：整个过程就是沿着树的高度往下爬，所以时间复杂度也是 O(logk)。

因此，无论是添加新的数据还是取出堆顶的元素，都需要 O(logk) 的时间。

初始化
优先队列的初始化是一个最重要的时间复杂度，是分析运用优先队列性能时必不可少的，也是经常容易弄错的地方。

举例：有 n 个数据，需要创建一个大小为 n 的堆。

误区：每当把一个数据加入到堆里，都要对其执行向上筛选的操作，这样一来就是 O(nlogn)。

解法：在创建这个堆的过程中，二叉树的大小是从 1 逐渐增长到 n 的，所以整个算法的复杂度经过推导，最终的结果是 O(n)。

注意：算法面试中是不要求推导的，你只需要记住，初始化一个大小为 n 的堆，所需要的时间是 O(n) 即可。

例题分析
LeetCode 第 347 题：给定一个非空的整数数组，返回其中出现频率前 k 高的元素。

说明：

你可以假设给定的 k 总是合理的，且 1 ≤ k ≤ 数组中不相同的元素的个数。

你的算法的时间复杂度必须优于 O(nlogn) ，n 是数组的大小

示例：car，car，book，desk，desk，desk

代码解读：

维护一个Priority（最大堆[]）队列，队列里的数据类型为长度为2的数组，num[0]对应元素的值，num[1]表示出现的频率

class Solution {
    public int[] topKFrequent(int[] nums, int k) {
        Map<Integer, Integer> occurances = new HashMap<Integer, Integer>();
        for(int num : nums){
            occurances.put(num, occurances.getOrDefault(num, 0) + 1);
        }
        PriorityQueue<int[]> queue = new PriorityQueue<int[]>(new Comparator<int[]>(){
            @Override
            //如果m[1] > n[1] 返回1 表示m[1]的优先级更高。默认提供的是最小堆
            public int compare(int[] m, int[] n){
                return m[1] - n[1];
            }
        });
        for(Map.Entry<Integer, Integer> entry: occurances.entrySet()){
            int num = entry.getKey();
            int count = entry.getValue();
            if(queue.size() >= k){
                if(count > queue.peek()[1]){
                    queue.poll();
                    queue.offer(new int[]{num, count});
                }
            }else{
                queue.offer(new int[]{num, count});
            }
        }
        int[] res = new int[k];
        for(int i = 0; i < k; i++){
            res[i] = queue.poll()[0];
        }
        return res;
    }
}

Comparator的是根据二叉树进行排序，并且是根据中序进行遍历的。
num1>num2?1:-1; 这个是三元运算符（具体可以了解下Java基础）

如果num1 > num2 则返回1，那么num1是右节点，num2是左节点，中序遍历后，那么compartor就是是按照num从小到大的顺序排列；
反之，num1>num2?-1:1则是如何num1 > num2 则返回-1，num1是左节点，num2是右节点，中序遍历后，那么compartor就是是按照num从大到小的顺序排列；