题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
思路
从数据流中读到数字,有多中数据结构储存,所以对应多种解决方法,有不同的时间复杂度。
数据结构 | 插入的时间复杂度 | 得到中位数的时间复杂度 |
没有排序的数组 | O(1) | O(n) |
排序的数组 | O(n) | O(1) |
排序的链表 | O(n) | O(1)(定义两个指针指向中间结点) |
二叉搜索树 | 平均O(logn) 最差O(n) | 平均O(logn)(二叉树结点中定义字段表示子结点数目) 最差O(n) |
ALV树 | O(logn)(插入代码南书写) | O(1)(将平衡因子改为左右子树结点数目差) |
最大堆和最小堆 | O(logn) | O(1) |
若数据流有序,均分后,左边部分总小于右边部分,左半部分的最大值,与右半部分的最小值的平均即为中位数。(偶数个的情况)
如果能保证左边部分数据都小于右边部分的数据,即使左、右部分内数据没有排序,仍能根据左边的最大值和右边的最小值得到中位数。
为了快速获得两部分的最值,选择用堆这一数据结构实现,将数据均分,左边存入最大堆,右边存入最小堆。如何解决:
(1)数据如何均分存在最大堆和最小堆中?
当当前数据为偶数个时,存入最小堆中,若为奇数个,存在最大堆中。
(2) 如何保证最大堆中的所有数字都小于最小堆中的?
若向最大堆中插入数字:先将数字插入最小堆中,然后将最小堆堆顶数字(总小于所有)插入到最大堆中
C++实现
class Solution {
public:
void Insert(int num)
{
count += 1;
if(count % 2 == 0)//数字个数为偶数,小顶堆中加一个元素,将数字先存入大顶堆中,再将大顶堆堆顶元素存入小顶堆
{
max.push(num);
min.push(max.top());
max.pop();
}
else
{
min.push(num);
max.push(min.top());
min.pop();
}
}
double GetMedian()
{
if(count % 2 == 0)
return (double)(max.top()+min.top())/2;
else
return max.top();
}
private:
priority_queue<int, vector<int>, less<int> > max;//降序,大顶堆,存数据流左半部分
priority_queue<int, vector<int>, greater<int> > min;//升序,小顶堆,存数据流右半部分
int count = 0;//记录读取的数字的个数
};