中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
思路
最直观的方法:
每次添加元素或查找中位数时对数组排序,在计算结果
时间复杂度:
- 若添加元素时排序,add-O(n),fineMedian(1)
- 若查询中位数时排序,add-O(n),fineMedian(nlogn)
若添加元素和查询中位数是随机操作,则整体为O(n^2)
改进:
动态维护一个最大堆和最小堆,每个堆各存储一半的数据
维护条件:
- 最大堆的堆顶比最小堆的堆顶小
- 最大堆和最小堆的大小小于等于1
获取中位数
class MedianFinder {
public:
/** initialize your data structure here. */
MedianFinder() {
}
void addNum(int num) {
if (big_queue.empty()){
big_queue.push(num);
return;//先往最大堆丢一个
}
if (big_queue.size() == small_queue.size()){//情况1两个堆大小相同
if (num < big_queue.top()){//如果新元素小于最大堆堆顶
big_queue.push(num);//放入最大堆
}
else{
small_queue.push(num);//否则放入最小堆
}
}
else if(big_queue.size() > small_queue.size()){//情况2最大堆size大
if (num > big_queue.top()){
small_queue.push(num);//如果新元素大于最大堆,那么push到最小堆
}
else{
small_queue.push(big_queue.top());
big_queue.pop();
big_queue.push(num);
//否则,将最大对堆顶push到最小堆,pop下后,再往最大堆里push新元素
}
}
else if(big_queue.size() < small_queue.size()){//情况3,最小堆size大
if (num < small_queue.top()){
big_queue.push(num);//如果新元素小于最小堆堆顶,新元素push到最大堆
}
else{
big_queue.push(small_queue.top());
small_queue.pop();
small_queue.push(num);
//否则,最小堆堆顶push到最大堆,pop后,新元素加入最小堆
}
}
}
double findMedian(){
if (big_queue.size() == small_queue.size()){
return (big_queue.top() + small_queue.top()) / 2;
}
else if (big_queue.size() > small_queue.size()){
return big_queue.top();
}
return small_queue.top();
}
private:
std::priority_queue<double> big_queue;
std::priority_queue<double, std::vector<double>,std::greater<double> > small_queue;
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/