一、需求
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例 1:
输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
示例 2:
输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
二、小/大顶堆
2.1 思路分析
- 新建小、大顶堆对象A、B(其中A用来存放数据流中较大的部分,B用来存放数据流中较小的部分),构造方法分别初始化小、大顶堆对象;
- 当向数据流插入元素时,若数据流中元素个数为奇数,那么应该放入B中,但不能直接放入,先放入A中,然后将A的堆顶元素给B;当数据流中元素个数为偶数时,那么应该放入A中,也不能直接放入,先放入B中,然后将B的堆顶元素给A;
- 求当前数据流中的中位数时,若当前数据流中元素个数为奇数,那么返回A的堆顶元素,若当前数据流中元素个数为偶数,那么返回A与B堆顶元素的平均值。
2.2 代码实现
class MedianFinder {
Queue<Integer> pqA;
Queue<Integer> pqB;
/** initialize your data structure here. */
public MedianFinder() {
pqA = new PriorityQueue<>();//小顶堆
//lambda表达式
pqB = new PriorityQueue<>((v1,v2)->(v2-v1));//大顶堆
}
public void addNum(int num) {
if(pqA.size() != pqB.size()) {
pqA.add(num);
pqB.add(pqA.poll());
} else {
pqB.add(num);
pqA.add(pqB.poll());
}
}
public double findMedian() {
if(pqA.size() != pqB.size()) {
return pqA.peek();
} else {
return (pqA.peek() + pqB.peek())/2.0;
}
}
}
2.3 复杂度分析
- 时间复杂度:①查找中位数为O(1),获取堆顶元素使用O(1)的时间;②添加数字O(logN),堆的插入和弹出操作使用O(logN)的时间;
- 空间复杂度:小顶堆A与大顶堆B最大同时存储N个元素,其中N为数据流中元素个数;
三、参考地址
作者:jyd