1.题目描述
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
2.解题思路与代码
2.1 解题思路
题目要求一个数据流的中位数,并且数量为奇数时返回中间一个,数量为偶数时返回中间两个数的平均值,我们可以使用一个大根堆一个小根堆来进行处理。大根堆存放流中较小的数,小根堆存放较大的数,并且当个堆大小相差超过 1 时,将数量多的堆堆顶弹出,并放入数量较小的堆中,使两个堆数量保持一致。下面进行详细的说明。
-
首先两个堆都是空的,此时将调用 addNum(3) 将 3 放入大根堆中
-
然后调用 addNum(4) ,放入的数 4 比大根堆的堆顶元素大,因此将 4 放入小根堆中,此时 4 位于堆顶。两个堆大小相同,所以数据流总数为偶数,因此中位数便使两个堆顶的平均数 3.5
-
接下来调用 addNum(2) ,此时 2 小于大根堆堆顶元素,将 2 放入大根堆中,此时数据流总数为奇数,因此中位数就是数据较多的那一个堆的堆顶值,即 3
-
再调用 addNum(1),按照前面的思路 1 应当放入大根堆中,此时大根堆和小根堆大小相差 2 ,因此需要弹出大根堆堆顶顶后放入小根堆中,即 3 放入小根堆中,以保持两个堆的数量平衡。此时两个堆大小相同,那么中位数就是 2.5
-
之后调用 addNum 方法是重复上面的操作便能够快速获取到数据流的中位数
2.2 代码
class MedianFinder {
PriorityQueue<Integer> maxQueue;
PriorityQueue<Integer> minQueue;
public MedianFinder() {
maxQueue = new PriorityQueue<>((o1, o2) -> o2 - o1);
minQueue = new PriorityQueue<>();
}
public void addNum(int num) {
if (maxQueue.size() == 0 || maxQueue.peek() > num) {
maxQueue.offer(num);
} else {
minQueue.offer(num);
}
if (Math.abs(maxQueue.size() - minQueue.size()) >= 2) {
if (maxQueue.size() > minQueue.size()) {
minQueue.offer(maxQueue.poll());
} else {
maxQueue.offer(minQueue.poll());
}
}
}
public double findMedian() {
if ((maxQueue.size() + minQueue.size()) % 2 == 0) {
return (double) (maxQueue.peek() + minQueue.peek()) / 2;
} else {
return maxQueue.size() > minQueue.size() ? maxQueue.peek() : minQueue.peek();
}
}
}
2.3 测试结果
通过测试
3.总结
- 使用大根堆和小根堆完成,大根堆存放较小的,小根堆存放较大的
- 每次放入数据时需要维持两个堆的大小平衡,即大根堆和小根堆的大小相差小于 2
- 当数据流总数为奇数时,中位数就是数量较多的堆的堆顶元素;数据流为偶数时,为两个堆堆顶元素的平均值