如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
#####理解:
数据流中找中位数,就会涉及到数据的插入和从现有数据中查找当前中位数这两个过程,如果需要控制复杂度,就需要综合考虑插入和查找两种操作的复杂度。
如果是无序数组插入容易但查找难,如果是有序数组虽然查找是O(1),但插入复杂了,找到一个相乘复杂度低于O(n)O(1)的,很容易想到把优化的重点放到插入部分,一旦数据有序查找就是O(1),就很容易了。前面的插入可以优化到O(logN),一种方法是使用AVL均衡树,另一种是采用堆,前者没有现成的结构实现起来费时费力,故我们采用后者。
将数列分成前后两半部分,前面一个最大堆,后面一个最小堆,当总个数为奇数的时候中位数就是最大堆的最大值弹出;总个数为偶数则是最大、最小的平均数。
**需要注意的是:在Insert*方法中,数字不是直接插入前或后阵营,而是先插到对面堆,再将对面弹出的最大/最小弹到阵营中,这是为了防止插入当前数据后破坏前/后部分所有值都小于/大于后/前部分的状态。**
import java.util.PriorityQueue;
import java.util.Comparator;
public class Solution {
//使用堆的好处是在插入环节复杂度是logN,而拿中位数是O(1),其他方法均在插入或查询中位数时是O(n);
//均衡树的方法时间复杂度与此方法相同,但AVL树不好实现,也没有现成的接口。
PriorityQueue<Integer> minHeap = new PriorityQueue<>();
PriorityQueue<Integer> maxHeap = new PriorityQueue<>(16, new Comparator<Integer>(){
@Override
public int compare(Integer o1, Integer o2){
return o2.compareTo(o1);//重写比较器,这样大的排在前了
}
});
int count = 0;
public void Insert(Integer num) {
count++;
if(count%2 == 1){
minHeap.offer(num);
maxHeap.offer(minHeap.poll());
}
else{
maxHeap.offer(num);
minHeap.offer(maxHeap.poll());
}
}
public Double GetMedian() {
if(count == 0 ){
return null;
}
if(count % 2 == 1){
return Double.valueOf(maxHeap.peek());
}
else{
return Double.valueOf(maxHeap.peek()+minHeap.peek())/2;//这里把2放到valueOf里面会错
}
}
}