剑指Offer:[第17天 排序(中等)]--->数据流中的中位数

本文介绍了如何使用小顶堆和大顶堆实现数据流中中位数的实时计算。通过维护两个堆,一个保存较大的一半元素,另一个保存较小的一半元素,确保在添加元素时保持堆的平衡,从而快速找到中位数。算法的时间复杂度为O(logN),空间复杂度为O(N)。示例展示了在不同数据流下如何调用`addNum`和`findMedian`方法来计算中位数。
摘要由CSDN通过智能技术生成


一、题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

例如:

[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
----void addNum(int num) - 从数据流中添加一个整数到数据结构中。
----double findMedian() - 返回目前所有元素的中位数。

示例1:

输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]

示例2:

输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]

限制:

最多会对 addNum、findMedian 进行 50000 次调用。


二、思路分析

注:思路分析中的一些内容和图片参考自力扣各位前辈的题解,感谢他们的无私奉献

思路

给定一长度为N的无序数组,其中位数的计算方法:首先对数组执行排序(使用O(NlogN)时间),然后返回中间元素即可(使用O(1)时间)。根据以上思路,可以将数据流保存在一个列表中,并在添加元素时保持数组有序。此方法的时间复杂度为O(N),其中包括:查找元素插入位置O(logN)(二分查找)、向数组某位置插入元素O(N)(插入位置之后的元素都需要向后移动一位)。
----借助堆可进一步优化时间复杂度。
建立一个小顶堆A和大顶堆B,各保存列表的一半元素,且规定
A保存较大的一半,长度为 N 2 \frac{N}{{\rm{2}}} 2N(N为偶数)或 N + 1 2 \frac{N+1}{2} 2N+1(N为奇数)
B保存较大的一半,长度为 N 2 \frac{N}{{\rm{2}}} 2N(N为偶数)或 N + 1 2 \frac{N+1}{2} 2N+1(N为奇数)
随后,中位数可仅根据A,B的堆顶元素计算得到。
在这里插入图片描述
算法流程:
设元素总数为N=m+nN,其中mn分别为AB中的元素个数。
addNum(num) 函数
m=n(即N为偶数):需向A添加一个元素。实现方法:将新元素num插入至B,再将B堆顶元素插入至A
m≠n(即N为奇数):需向B添加一个元素。实现方法:将新元素num插入至A,再将A堆顶元素插入至B
这样做的理由是:
对于第一种情况,可能num属于B,所以将num先插入B,然后将B的堆顶元素插入至A,这样可以保证A始终保存较大的一半。
对于第二种情况,可能num属于A,所以将num先插入A,然后将A的堆顶元素插入至B,这样可以保证B始终保存较小的一半。
findMedian() 函数
m=n(N为偶数):则中位数为(A的堆顶元素+B的堆顶元素)/2
m≠n(N为奇数):则中位数为A的堆顶元素。
案例分析:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
复杂度分析:
时间复杂度:
查找中位数 O ( 1 ) \rm{O(1)} O(1):获取堆顶元素使用O(1)时间
添加数字 O ( l o g N ) \rm{O(logN)} O(logN):堆的插入和弹出操作使用O(logN)时间
空间复杂度 O ( N ) \rm{O(N)} O(N):其中N为数据流中的元素数量,小顶堆A和大顶堆B最多同时保存N个元素


三、整体代码

整体代码如下

class MedianFinder {
public:
    // 最大堆,存储左边一半的数据,堆顶为最大值
    priority_queue<int, vector<int>, less<int>> maxHeap;
    // 最小堆, 存储右边一半的数据,堆顶为最小值
    priority_queue<int, vector<int>, greater<int>> minHeap;
    /** initialize your data structure here. */
    MedianFinder() {
    }

    // 维持堆数据平衡,并保证左边堆的最大值小于或等于右边堆的最小值
    void addNum(int num) {
        /*
         * 当两堆的数据个数相等时候,左边堆添加元素。
         * 采用的方法不是直接将数据插入左边堆,而是将数据先插入右边堆,算法调整后
         * 将堆顶的数据插入到左边堆,这样保证左边堆插入的元素始终是右边堆的最小值。
         * 同理左边数据多,往右边堆添加数据的时候,先将数据放入左边堆,选出最大值放到右边堆中。
         */
        if (maxHeap.size() == minHeap.size()) {
            minHeap.push(num);
            int top = minHeap.top();
            minHeap.pop();
            maxHeap.push(top);
        } else {
            maxHeap.push(num);
            int top = maxHeap.top();
            maxHeap.pop();
            minHeap.push(top);
        }
    }
    
    double findMedian() {
        if (maxHeap.size() == minHeap.size()) {
            return (maxHeap.top()+minHeap.top())*1.0/2;
        } else {
            return maxHeap.top()*1.0;
        }
    }
};

运行,测试通过
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

知初与修一

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值