leetcode 295. 数据流的中位数 - 大根堆 - 小根堆 - 有序列表 - B树 B+ 树

题目来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems
特别鸣谢:来自夸夸群的 醉笑陪公看落花@知乎王不懂不懂@知乎
感谢醉笑陪公看落花@知乎 倾囊相授,感谢小伙伴们督促学习,一起进步

参考文章:python中heapq的用法(最小堆) https://blog.csdn.net/weixin_42317507/article/details/92801893

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:

addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-median-from-data-stream

题目分析

心路历程如下:

  1. 设计数据结构求中位数,只要左边a个数都比中位数小,右边b个数都比中位数大就行。 abs(a-b)<=1

  2. 转换为左边a个数字中最大的数字比中位数小,右边b个数中最小的数字比中位数大就行

  3. 取集合中的最大和最小,就可以考虑大根堆和小根堆

  4. 由于python中只封装了小根堆,要存大根堆的时候,我们在小根堆中把数字取一个负号即可实现

  5. 如果大小根堆的长度一致,则取两个堆顶的数字除以2

  6. 如果长度不一致,则取堆结点多的那个根堆的堆顶

  7. 如果插入某个数字,使两个堆的长度差2,则进行调整

方法1 - 草图

假如初始的时候有一些数字在集合中了

在这里插入图片描述

方法1 大根堆 小根堆 - 代码 - 通过

addNum : O(log2(n))
findMedian: O(1)

'''
最小堆和最大堆 - 通过
'''
import heapq
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.lh = []
        self.rh = []

    def addNum(self, num: int) -> None:
        if len(self.lh) == 0 or num > 0-self.lh[0]:
            heapq.heappush(self.rh,num)
        else:
            heapq.heappush(self.lh, 0-num)

        ln = len(self.lh)
        rn = len(self.rh)

        if ln-rn==2:
            heapq.heappush(self.rh,0-heapq.heappop(self.lh))
        elif rn - ln==1:
            heapq.heappush(self.lh,0-heapq.heappop(self.rh))
        else:pass


    def findMedian(self) -> float:
        ln = len(self.lh)
        rn = len(self.rh)
        return (0-self.lh[0] + self.rh[0]) / 2 if ln ==rn else float(0-self.lh[0])

方法2 有序列表 - 库函数 - 代码 - 通过

用库函数维护一个有序列表,每次取中间的数字就行

addNum : O(log2(n))
findMedian: O(1)
from sortedcontainers import SortedList
class MedianFinder:

    def __init__(self):
        """
        initialize your data structure here.
        """
        self.nums = SortedList()
        self.left = 0
        self.right = 0


    def addNum(self, num: int) -> None:
        self.nums.add(num)

    def findMedian(self) -> float:
        n = len(self.nums)
        return (self.nums[n//2]+self.nums[n//2-1])/2 if n%2 ==0 else float(self.nums[n//2])

知识点搜集

小根堆

概念

后裔节点总是不大于当前节点

堆的概念图和基本操作来源 https://blog.csdn.net/weixin_42317507/article/details/92801893

在这里插入图片描述

基本操作- 插入和删除后堆如何变化

下面这张草图中,删除堆顶元素的顺序有问题,应该是自顶向下调整 参考下一个标题 删除堆顶元素
在这里插入图片描述
测试这个想法似乎可行,但是维基百科不是这样调整的。
维基百科是:删除最小值只是删除数组中索引已知的任意节点的特殊情况。在这种情况下,数组的最后一个元素被删除(减少数组的长度)并用于替换数组头部的根。push-down然后在根索引上调用以恢复堆属性
https://en.wikipedia.org/wiki/Min-max_heap
在这里插入图片描述
在测试了一下其他的用例,发现之前的想法是错的,如果直接从孩子中选取最小的值,无法保证能最后空下来的是最后一个元素。还是得用最后一个元素来替换根,然后自顶向下调整

在这里插入图片描述

删除堆顶元素

在这里插入图片描述

a = [3,4,8,9,7,10,9,15,20,13]
b = a[:]
c = a[:]
heapq.heapify(a)
heapq.heappush(b,2)
heapq.heappop(c)
print(a) # [3, 4, 8, 9, 7, 10, 9, 15, 20, 13]
print(b) # [3, 4, 8, 9, 7, 10, 9, 15, 20, 13]
print(c) # [4, 7, 8, 9, 13, 10, 9, 15, 20]

基本操作记录

import heapq

lst = [1,2,3,5,1,5,8,9,6]

'''
一秒变成堆
'''
heapq.heapify(lst)
[1, 1, 3, 5, 2, 5, 8, 9, 6]

'''
最小的(顶端)再见
'''
heapq.heappop(lst)
[1, 2, 3, 5, 6, 5, 8, 9]

'''
最小的滚蛋,新人进入
'''
heapq.heapreplace(lst,99)
[2, 5, 3, 9, 6, 5, 8, 99]

'''
新人比最小的大,新人进入;若否,则不管
'''
heapq.heappushpop(lst,1)
[2, 5, 3, 9, 6, 5, 8, 99]

heapq.heappushpop(lst,66)
[3, 5, 5, 9, 6, 66, 8, 99]

'''
最大的n个是谁;
最小的n个是谁;
'''
print(heapq.nlargest(3,lst))
[99, 66, 9]
print(heapq.nsmallest(3,lst))
[3, 5, 5]

'''
合并
'''
lst1 = [100,101]
lst2 = [3, 5, 5, 9, 6, 66, 8, 99]
lst = list(heapq.merge(lst1,lst2))
[3, 5, 5, 9, 6, 66, 8, 99, 100, 101]

https://blog.csdn.net/weixin_42317507/article/details/92801893

python有序列表的维护 - B树和B+树

库函数 : from sortedcontainers import SortedList
大概看了一下SortedList的初始化,和add()方法,发现它可能是用B+树进行维护的。 B+ 树的叶节点中存的是列表,最后维护的数组通过映射实现O(1)时间复杂度的查找。添加元素是O(log2(n))

关于B树和B+树的参考文档

B树每个结点都存data

在这里插入图片描述
B+树的每个叶节点存data,并且叶节点之间要连接起来
在这里插入图片描述

B树 wiki定义

https://en.wikipedia.org/wiki/B-tree
在这里插入图片描述

m阶B树的插入与分裂

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

删除

在这里插入图片描述

在这里插入图片描述
删除20之后
在这里插入图片描述

B+ 树 wiki定义

B+ 树的根代表树中值的整个范围,其中每个内部节点都是一个子区间

B 树 和 B+ 树 二者区别

B+ 树的叶子(最底部的索引块)通常在链表中相互链接;这使得范围查询或通过块的(有序)迭代更简单和更有效(尽管即使没有这个添加也可以实现上述上限)。这不会显着增加树上的空间消耗或维护。这说明了 B+树相对于 B 树的显着优势之一;在 B 树中,由于并非所有键都存在于叶子中,因此无法构建这样的有序链表。因此,B+tree 作为数据库系统索引特别有用,其中数据通常驻留在磁盘上,因为它允许 B+tree 实际上提供一个有效的结构来容纳数据本身

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值