问题描述:如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
思路:建立大根堆和小根堆,PriorityQueue(优先级队列)默认为小根堆,大根堆需要重写比较器。大根堆存放较小一半的数字,小根堆存放较大一半的数字,则大根堆堆顶为较小一半数字的最大值,小根堆堆顶为最大一半数字的最小值,通过两个堆堆顶,总能找到数据流中的中位数。以{5,3,6,7}为例进行说明:
第一个数字5首先进入大根堆,此时大根堆为{5},小根堆为{};
第二个数字3比5小,则放入大根堆中,此时大根堆为{5,3},小根堆为{},大根堆大小与小根堆大小差距大于1,则从大根堆堆顶弹出5,放入小根堆;
第三个数字6比3大,则放入小根堆,此时大根堆为{3},小根堆为{5,6};
第四个数7比3大,则放入小根堆,此时小根堆为{5,6,7},大根堆为{3},大小差为2,超过1,则从小根堆堆顶弹出5放入大根堆中,此时大根堆为{5,3},小根堆为{6,7},则中位数为两个堆堆顶的平均值。
代码:
import java.util.*;
public class Solution {
private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(new Comparator<Integer>(){//大根堆需要重写比较器
@Override
public int compare(Integer o1, Integer o2){
return o2 - o1;
}
});
//优先级队列默认为小根堆
private PriorityQueue<Integer> minHeap = new PriorityQueue<Integer>();
public void Insert(Integer num) {
if(maxHeap.isEmpty()|| num <= maxHeap.peek()){
maxHeap.add(num);
}else{
minHeap.add(num);
}
modifyTwoHeaps();//根据两个堆大小进行调整
}
public Double GetMedian() {
if(maxHeap.isEmpty()){
return null;
}
if(maxHeap.size() == minHeap.size()){
return ((double)(maxHeap.peek() + (double)minHeap.peek()) / 2);
}else{//奇数,返回size()较大的堆的堆顶值
return maxHeap.size() > minHeap.size() ? (double)maxHeap.peek() : (double)minHeap.peek();
}
}
private void modifyTwoHeaps(){
if(maxHeap.size() == minHeap.size() + 2){
minHeap.add(maxHeap.poll());
}
if(minHeap.size() == maxHeap.size() + 2){
maxHeap.add(minHeap.poll());
}
}
}