面试题41: 数据流中的中位数
题目:如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
解题思路:
将整个数据容器分隔成两部分,左边部分的数据比右边部分的数据小。用一个最大堆实现左边的数据容器,用一个最小堆实现右边的数据容器。
// 数据流存放在数据容器中
为了保证数据平均分配到两个堆中,因此两个堆中数据的数目之差不能超过1。为了实现平均分配,可以在数据总数目是偶数时,把新数据插入最小堆;否则插入最大堆。
还要保证最大对中所有数据都要小于最小堆中的数据。当数据需要插入最小堆时,若插入的数小于最大堆中的数据,则可以先把这个新的数据插入最大堆,接着把最大堆中最大的数字拿出来插入最小堆。
template <typename T>
class DynamicArray {
public:
void Insert(T num) {
if (((min.size() + max.size()) & 1) == 0) {
if (min.size() > 0 && num < max[0]) {
max.push_back(num);
push_heap(max.begin(), max.end(), less<T>());
num = max[0];
pop_heap(max.begin(), max.end(), less<T>());
max.pop_back();
}
min.push_back(num);
push_heap(min.begin(), min.end(), greater<T>());
}
else {
if (min.size() > 0 && min[0] < num) {
min.push_back(num);
push_heap(min.begin(), min.end(), greater<T>());
num = min[0];
pop_heap(min.begin(), min.end(), greater<T>());
min.pop_back();
}
max.push_back(num);
push_heap(max.begin(), max.end(), greater<T>());
}
}
T GetMedian() {
int size = min.size() + max.size();
if (size == 0) {
throw exception("No numbers are available");
}
T median = 0;
if ((size & 1) == 1) {
median = min[0];
}
else {
median = (min[0] + max[0]) / 2;
}
return median;
}
private:
vector<T> min;
vector<T> max;
};