面试题41:数据流中的中位数
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
思路和代码
中位数就是排序后中间的数,那么用最大堆来保存中位数左半部分的数,最小堆保存中位数右半部分数。
可以通过当数字总数为奇数时插入左半部分,也就是最大堆,当数据总数为偶数时,插入右半部分,也就是最小堆,这样就可以保证两部分数字个数差不会大于1.
但是这样又有一个问题,有可能插入最小堆的元素比最大堆里面的元素还要小,所以可以考虑先插进最大堆,然后将最大堆里面最大的元素插入最小堆,这样即可保证最小堆里的元素肯定大于最大堆里的元素。
class Solution {
private:
vector<int> min;
vector<int> max;
public:
void Insert(int num)
{
//如果是偶数,则插入最小堆
if(((min.size() + max.size()) & 1) == 0){
//判断该数是否大于最大堆的堆顶,若大于,则插入最大堆,然后将最大堆的堆顶插入最小堆
if(max.size() > 0 && num < max[0]){
max.push_back(num);//插入最大堆
push_heap(max.begin(), max.end(), less<int>());//重排最大堆
num = max[0];//获取最大堆的最大元素,准备插入最小堆
pop_heap(max.begin(), max.end(), less<int>());
max.pop_back();
}
//插入最小堆
min.push_back(num);
push_heap(min.begin(), min.end(), greater<int>());
}
else{
//奇数插入最大堆,先判断该元素是否比最小堆最小元素大
//如果num比最小堆堆顶大,则插入最小堆,然后再将最小堆中最小元素插入最大堆
if(min.size() > 0 && num > min[0]){
min.push_back(num);
push_heap(min.begin(), min.end(), greater<int>());
num = min[0];
pop_heap(min.begin(), min.end(), greater<int>());
min.pop_back();
}
//插入最大堆
max.push_back(num);
push_heap(max.begin(), max.end(), less<int>());
}
}
double GetMedian()
{
if((max.size()+min.size())<=0)
return 0.0;
else{
if(((max.size()+min.size())&1)==0)
{
return (max[0]+min[0])/2.0;
}
else
{
return (double)min[0];
}
}
}
};