1、题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
2、示例数据:
输入:
[“MedianFinder”,“addNum”,“addNum”,“findMedian”,“addNum”,“findMedian”]
[[],[1],[2],[],[3],[]]
输出:
[null,null,null,1.50000,null,2.00000]
3、代码
class MedianFinder {
public:
/** initialize your data structure here. */
priority_queue<int> maxHeap;
priority_queue<int,vector<int>,greater<int>> minHeap;
MedianFinder() {
}
void addNum(int num) {
if(maxHeap.size()>minHeap.size()){
if(num>=maxHeap.top()){
minHeap.push(num);
}else{
minHeap.push(maxHeap.top());
maxHeap.pop();
maxHeap.push(num);
}
}else if(maxHeap.size()==minHeap.size()){
if(maxHeap.size()==0){
maxHeap.push(num);
}else{
if(num<=minHeap.top()){
maxHeap.push(num);
}else{
maxHeap.push(minHeap.top());
minHeap.pop();
minHeap.push(num);
}
}
}
return;
}
double findMedian() {
if(minHeap.size()==maxHeap.size()){
return double((minHeap.top()+maxHeap.top())/2.0);
}else{
return (double) maxHeap.top();
}
}
};
4、解释
基本原理
- 一个最大堆,一个最小堆;
- 保证最大堆的元素都不大于最小堆的元素;
- 保证最大堆的元素个数与最小堆相同或者多一个。
综上,数据流的中位数只和堆顶元素有关。
具体实现
当插入数据的时候有两种情况:
-
两个堆元素个数相同
如果nun不比最小堆堆顶元素大,则直接插入最大堆中,如果比它大,则
先将最小堆中的最小元素移到最大堆中,再将数据插入最小堆,这样既保
证了原理2,又保证了原理1.
-
最大堆个数多一
与1实现类似。