题目描述:
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
方法1:
主要思路:
(1)使用两个堆:最大堆和最小堆,来存储添加的数据流的元素;
(2)这样,保证两个堆的大小差距最大只为1,则两个堆的堆顶元素应该为数据流中中间元素;
(3)在需要弹出当前数据流中的中间值时,若当前的两个堆的大小一致,则返回两个堆的堆顶元素之和的平均值,否则,就返回较大的堆的堆顶元素;
(4)为了构造这样的两个堆,则需要将添加的元素先添加到一个堆中,在将该堆的堆顶元素弹出,放入另一堆中,并在后面判断两个堆的大小,决定是否需要再弹出一个元素;
class MedianFinder {
public:
priority_queue<int,vector<int>,less<int>> big_heap;//最大堆
priority_queue<int,vector<int>,greater<int>> little_heap;//最小堆
/** initialize your data structure here. */
MedianFinder() {
}
void addNum(int num) {
//先将当前数据流中的元素加入到最小堆中,再将最小堆的堆顶元素弹出到最大堆中
little_heap.push(num);
big_heap.push(little_heap.top());
little_heap.pop();
//保证两个堆的大小最大差距为1,且最小堆数量可能更多一点
if(little_heap.size()<big_heap.size()){
little_heap.push(big_heap.top());
big_heap.pop();
}
}
double findMedian() {
if(little_heap.size()==big_heap.size()){//两个堆的大小一致时,返回两个堆堆顶元素的平均值
return (little_heap.top()+big_heap.top())/2.0;
}
return little_heap.top();//否则,返回最小堆的堆顶元素
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/