数据结构与算法——优先队列

一、优先队列

优先队列按照队列的方式正常入队,但按照优先级出队。有两种实现方式:(二插堆、多项式堆等等)和二叉搜索树。这里重点讲解二叉堆,关于二叉搜索树的内容见这篇文章

堆是一种特殊的完全二叉树。大根堆: 完全二叉树的任一节点都比其孩子节点大。小根堆: 完全二叉树的任一节点都比其孩子节点小。堆的向下调整: 假设根节点的左右子树都是堆,但根节点不满足堆的性质,可以通过一次向下调整将其变成一个堆。因为二叉堆是完全二叉树,一般可以用数组来表示,这样不会浪费空间。大根堆和小根堆的举例如下所示:
在这里插入图片描述
用数组表示的二叉堆,有如下性质:

  • i i i个节点的左孩子的下标为 2 ∗ i + 1 2*i+1 2i+1,右孩子的下标为 2 ∗ i + 2 2*i+2 2i+2
  • i i i个节点的父亲节点的下标为 ( i − 1 ) / / 2 (i-1)//2 (i1)//2

二叉堆的时间复杂度:

  • 插入操作: O ( log ⁡ n ) O(\log n) O(logn)
  • 删除操作: O ( log ⁡ n ) O(\log n) O(logn)
  • 查询最小值: O ( 1 ) O(1) O(1)

python实现:heapq

import heapq

# 将array列表转为堆的结构
heap.heapify(array)
# 弹出堆中的最小值
heapq.heappop(array)
# 往堆中插入新值a
heapq.heappush(array, a)
# 先进行heappop(array),再进行heappush(array, a)操作
heapq.heapreplace(array, a)
# 获得array中前k个最大的值
heapq.nlargest(k, array)
# 获得array中前k个最小的值
heapq.nsmallest(k, array)

二、例题

1、合并k个有序链表

此题为leetcode第23题
合并 k 个排序链表,返回合并后的排序链表。

import heapq
class Solution:
    def mergeKLists(self, lists: List[ListNode]) -> ListNode:
        head = p = ListNode(0)
        # 建立堆
        a = []
        for i in range(len(lists)):
            if lists[i] :
                # 元组在heapq里比较的机制是从元组首位0开始,即遇到相同,就比较元组下一位
                # 比如(1,2), (1,3),前者比后者小。
                # 这题刚好node值有重复的,同时ListNode无法被比较,所以会报错
                heapq.heappush(a, (lists[i].val, i))
                lists[i] = lists[i].next
        while a:
            val, idx = heapq.heappop(a)
            p.next = ListNode(val)
            p = p.next
            if lists[idx]:
                heapq.heappush(a, (lists[idx].val, idx))
                lists[idx] = lists[idx].next
        return head.next
  • 时间复杂度: O ( n log ⁡ k ) O(n \log k) O(nlogk)
  • 空间复杂度: O ( k + n ) O(k+n) O(k+n),最小堆需要k个空间,新链表需要n个空间

2、数组中的第K个最大元素

此题为leetcode第215题
思路:使用heapq,首先定义一个空数组res,然后将nums里的前k个元素依次heappush到res中,建立小根堆。然后遍历nums剩下的元素,如果大于堆顶元素则heapreplace。最后的结果就是堆顶元素。

import heapq
class Solution:
    def findKthLargest(self, nums: List[int], k: int) -> int:
        n = len(nums)
        # 建立含k个元素的小根堆
        temp = []
        for i in range(k):
            heapq.heappush(temp, nums[i])
        
        # 遍历nums里剩下的元素,比堆顶大的话更新小根堆
        for i in range(k, n):
            top = temp[0]
            if nums[i] > top:
                heapq.heapreplace(temp, nums[i])
        # 最后结果为堆顶元素
        return temp[0]

3、前K个高频元素

此题为leetcode第347题
思路:首先利用哈希表统计nums里的元素num出现的频率。然后建立大小为k的小根堆heap,heap列表中的元素为元组,包含num及其频率。堆满后,若新加的数大于堆顶元素的频率,则heapreplace堆顶元素。最后heap里包含的就是前K个高频元素。

import heapq
class Solution:
    def topKFrequent(self, nums: List[int], k: int) -> List[int]:
        # 统计元素出现频率
        hash = {}
        for num in nums:
            hash[num] = hash.get(num, 0) + 1
        
        heap = []
        for num, freq in hash.items():
            if len(heap) == k:
                if heap[0][0] < freq:
                    heapq.heapreplace(heap, (freq, num))
            else:
                heapq.heappush(heap, (freq, num))
        res = []
        while heap:
            res.append(heapq.heappop(heap)[1])
        return res

4、数据流中的第k大元素

此题为leetcode第703题
设计一个找到数据流中第K大元素的类(class)。注意是排序后的第K大元素,不是第K个不同的元素。你的 KthLargest 类需要一个同时接收整数 k 和整数数组nums 的构造器,它包含数据流中的初始元素。每次调用 KthLargest.add,返回当前数据流中第K大的元素。

import heapq
class KthLargest:
    def __init__(self, k: int, nums: List[int]):
        self.nums = nums
        self.k = k
        heapq.heapify(self.nums)
        # 留下k个元素,即前k大的
        while len(self.nums) > k:
            heapq.heappop(self.nums)

    def add(self, val: int) -> int:
        if len(self.nums) < self.k:
            heapq.heappush(self.nums, val)
        elif self.nums[0] < val:
            # 新的值更大则更新
            heapq.heapreplace(self.nums, val)

        return self.nums[0]
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值