数据流的中位数

数据流的中位数

1.题目描述

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
在这里插入图片描述

2.思路

两个优先队列:
1.用于存储中位数左边数字的最大堆 max_heap
2.用于存储中位数右边数字的最小堆 min_heap
如果数据的个数为奇数,则最大堆比最小堆多一个元素,如果是偶数,最大堆最小堆的个数相同。
3.添加一个数 num:
将 num 添加到最大堆 max_heap。因为 max_heap收到了一个新元素,所以我们:
(1)必须为 min_heap做一个平衡步骤。因此,从 max_heap中移除最大的元素并将其提供给 min_heap。
(2)在上一个操作之后,最小堆 min_heap可能会比最大堆 max_heap保留更多的元素。我们通过从 min_heap中去掉最小的元素并将其提供给 max_heap来解决这个问题。

4.代码

class MedianFinder {
public:
    /** initialize your data structure here. */
    MedianFinder() {
        //priority_queue<int,vector<int>,less<int>> max_heap;
        //priority_queue<int,vector<int>,greater<int>> min_heap;
    }
    
    void addNum(int num) {
        max_heap.push(num);
        //平衡两个堆
        min_heap.push(max_heap.top());
        max_heap.pop();

        if(max_heap.size() < min_heap.size()){
            max_heap.push(min_heap.top());
            min_heap.pop();
        }
    }
    
    double findMedian() {
        return max_heap.size() > min_heap.size() ? (double)max_heap.top() : (max_heap.top() + min_heap.top())*0.5;
    }
public:
    priority_queue<int,vector<int>,less<int>> max_heap;
    priority_queue<int,vector<int>,greater<int>> min_heap;
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

4.复杂度分析

时间复杂度:O(5⋅logn)+O(1)≈O(logn)。
最坏情况下,从顶部有三个堆插入和两个堆删除。每一个都需要花费 O(logn) 时间。
找到平均值需要持续的 O(1) 时间,因为可以直接访问堆的顶部。
空间复杂度:O(n) 用于在容器中保存输入的线性空间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值