中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
思路:
直观的方法:
存储结构使用数组,每次添加元素或者查找中位数时对数组进行排序,再计算结果
时间复杂度:
1、若添加元素时排序,addNum复杂度O(n),findMedian复杂度为O(1)
2.若查询中位数时排序,addNum复杂度为O(1),findMedian复杂度为O(nlogn)
若添加元素或查询中位数是随机的操作,共n次操作,按上述思想,整体复杂度最佳为O(n^2)
另一种思路:巧用堆的性质
动态维护一个最大堆与一个最小堆,最大堆存储一半数据,最小堆存储一般数据,维持最大堆的堆顶比最小堆的堆顶小
添加数据进入堆中的状态
状态1:
最大堆与最小堆元素个数相同
最大堆的堆顶比最小堆的堆顶小
状态2:
最大堆比最小堆多一个元素
如果新元素小于最大堆堆顶,则将最大堆的堆顶push进入最小堆,将最大堆的堆顶移除(pop),将新元素添加至最大堆
如果新元素大于最大堆堆顶,将新元素直接push进入最小堆
状态3:
最大堆比最小堆少一个元素
如果新元素小于最小堆堆顶,将新元素直接push进入最大堆
如果新元素大于最小堆堆顶,将最小堆的堆顶push进入最大堆,将最小堆的堆顶移除,将新元素添加至最小堆。
获取中位数思路
1、最大堆最小堆中的元素个数相同
中位数是最大堆堆顶和最小堆堆顶的平均值
2、最大堆比最小堆多一个元素,则中位数为最大堆堆顶元素
3、最大堆比最小堆少一个元素,则中位数为最小堆堆顶
class MedianFinder {
public:
/** initialize your data structure here. */
MedianFinder() {
}
void addNum(int num) {
if(big_queue.empty()){
big_queue.push(num);
//return;
}
if(big_queue.size() == small_queue.size()){
if(num < big_queue.top()){
big_queue.push(num);
}
else{
small_queue.push(num);
}
}
else if(big_queue.size() > small_queue.size()){
if(num > big_queue.top()){
small_queue.push(num);
}
else{
small_queue.push(big_queue.top());
big_queue.pop();
big_queue.push(num);
}
}
else if(big_queue.size() < small_queue.size()){
if(num < small_queue.top()){
big_queue.push(num);
}
else{
big_queue.push(small_queue.top());
small_queue.pop();
small_queue.push(num);
}
}
}
double findMedian() {
if(big_queue.size() == small_queue.size()){
return (big_queue.top() + small_queue.top()) / 2;
}
else if(big_queue.size() > small_queue.size()){
return big_queue.top();
}
return small_queue.top();
}
private:
std::priority_queue<double> big_queue;
std::priority_queue<double, vector<double>,greater<double>> small_queue;
};