题目链接:https://leetcode-cn.com/problems/find-median-from-data-stream/
题目描述
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶
- 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
- 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
思路
- 用一个最大堆存储左区间数组,最小堆存储右区间数组;左区间元素均小于右区间元素。用堆的好处在于得到中位数只需要找堆顶元素,时间复杂度为O(1)。
- 控制最大堆与最小堆的长度之差不大于1,并且最大堆长度大于等于最小堆。
- 使用
priority_queue
构建最大堆和最小堆 - findMedian:如果元素总数为偶数,返回最大堆堆顶和最小堆堆顶的平均值,如果总数是奇数,则范围最大堆堆顶。
代码
class MedianFinder {
priority_queue<int, vector<int>, less<int>> left; // 最大堆
priority_queue<int, vector<int>, greater<int>> right; // 最小堆
public:
/** initialize your data structure here. */
MedianFinder() {}
void addNum(int num) {
// 插入元素
if(left.empty() || num <= left.top())
left.push(num);
else
right.push(num);
// 调整两个堆的元素数
if(left.size() < right.size()){
int val = right.top();
left.push(val);
right.pop();
}
if(left.size() - right.size()>1){
int val = left.top();
right.push(val);
left.pop();
}
}
double findMedian() {
if((left.size() + right.size()) & 1)
return left.top();
else
return (left.top() + right.top()) / 2.0;
}
};