如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例 1:
输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
示例 2:
输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
限制:
- 最多会对 addNum、findMedia进行 50000 次调用。
方法一:排序法
此方法是最简单直接的一个方法,我们将添加的数保存在数组中,返回中位数时,只需将数组排序,返回中间位置数即可。
本题难度为 困难,显然一定存在更加优化的方法。
class MedianFinder {
vector<double> store;
public:
// Adds a number into the data structure.
void addNum(int num)
{
store.push_back(num);
}
// Returns the median of current data stream
double findMedian()
{
sort(store.begin(), store.end());
int n = store.size();
// n & 1 判断n为奇数还是偶数,奇数为1,偶数为0
return (n & 1 ? store[n / 2] : (store[n / 2 - 1] + store[n / 2]) * 0.5);
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/
class MedianFinder {
vector<int> store; // resize-able container
public:
// Adds a number into the data structure.
void addNum(int num)
{
if (store.empty()){
store.push_back(num);
}
else{
// binary search and insertion combined
/*lower_bound()函数是用来求一个容器中,第一个大于等于所要查找的元素的地址,具体的原理是二分查找,因此它只能用于非降序序列。
他有三个参数,第一个参数是容器的初始地址,第二个参数是容器的末尾位置,第三个参数是所要查找的元素值。
返回值是第一个大于等于所要查找的元素的地址。*/
store.insert(lower_bound(store.begin(), store.end(), num), num);
}
}
// Returns the median of current data stream
double findMedian()
{
int n = store.size();
return n & 1 ? store[n / 2] : (store[n / 2 - 1] + store[n / 2]) * 0.5;
}
};
/**
* Your MedianFinder object will be ![i](https://img-blog.csdnimg.cn/2020042011192837.png)nstantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/
方法三:优先队列(堆)
【什么是优先队列】
我们将中位数左边的数保存在大顶堆中,右边的数保存在小顶堆中。这样我们可以在O(1) 时间内得到中位数。
注意:Python 中没有大顶堆,只能将值取负保存在小顶堆来模拟。为了方便理解,将堆用优先队列表示,如下图。
(https://pic.leetcode-cn.com/93dae43ac85d81bc27115a2383c941919d64ba8d432dead87119c484ef8d6b2f-%E5%B9%BB%E7%81%AF%E7%89%871.JPG)
class MedianFinder {
priority_queue<int> lo; // 大顶堆
priority_queue<int, vector<int>, greater<int>> hi; // 小顶堆
public:
// Adds a number into the data structure.
void addNum(int num)
{
lo.push(num); // 加到大顶堆
hi.push(lo.top()); // 平衡
lo.pop();
if (lo.size() < hi.size()) { // 维护两个堆元素个数
lo.push(hi.top());
hi.pop();
}
}
// Returns the median of current data stream
double findMedian()
{
return lo.size() > hi.size() ? (double) lo.top() : (lo.top() + hi.top()) * 0.5;
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/