数据流中的中位数(剑指offer)

原题来自牛客网剑指offer:链接

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

思路

假设数据已经排好序,用P1、P2指向中位数,那么当数据个数为奇数时,P1、P2指向同一个数据;当数据个数为偶数时,P1、P2指向中间的两个数。

显然可以得知数据会被分隔成两部分,位于左边的数据比右边的数据小。此外,P1会指向左边部分最大的数,P2指向的数据是右边部分最小的数。如下图所示:

在这里插入图片描述

因此我们需要满足两个点:

  1. 容器左边的数据都小于右边的数据
  2. 可以快速得到左边最大的数和右边最小的数

所以我们可以采用如下思路:用一个最大堆实现左边的数据容器,用最小堆实现右边的数据容器。当数据个数为偶数时,中位数就是两个堆的根节点的平均值;当数据个数为奇数时,中位数就是最小堆的根节点。

考虑以下具体细节:

  1. 我们要保证数据平均分配到两个堆中,即数据数目之差不超过1,因此我们可以采用以下策略:在数据数目为偶数时把新数据插入到最小堆,数目为奇数时插入到最大堆。
  2. 我们还要保证最大堆中所有数据小于最小堆中的数据,因此我们可以采用以下策略:比如当数据数目是偶数时,我们需要将数据插入最小堆,可以先将其放入最大堆,然后把最大堆的根节点(即最大数字)拿出来插回到最小堆中,这样子就可以保证最小堆中所有数字都大于最大堆数字。

下图为《剑指offer》所述各数据结构解决此题的复杂度:

在这里插入图片描述

之所以不采用AVL树是因为没有可以直接调用的相关容器,不好实现。所以采用最大堆和最小堆,插入效率为O(logn),得到中位数效率为O(1)。

具体实现的时候我使用优先队列priority_queue,因为底层就是堆实现的,用priority_queue比较方便些。直接用堆的话要make_heap、push_heap、pop_heap,有点麻烦。

代码如下:

class Solution {
public:
    int total;
    priority_queue<int,vector<int>,greater<int>> big;
    priority_queue<int,vector<int>,less<int>> small;
    Solution():total(0){}
    void Insert(int num)
    {
        if(total%2==0){
            big.push(num);
            small.push(big.top());
            big.pop();
        }
        else{
            small.push(num);
            big.push(small.top());
            small.pop();
        }
        total++;
    }
 
    double GetMedian()
    {
        if(total%2==0)
            return (double)(big.top()+small.top())/2;
        else
            return small.top();
    }
};
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值