题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
分析
想法1:使用动态数组ArrayList,那么每次插入数据都进行一次0(n)的插入,根据ArrayList.size()返回中位数,复杂度为0(n2)
想法2:先用java集合PriorityQueue来设置一个小顶堆和大顶堆,大顶堆用来存较小的数,从大到小排列;小顶堆存较大的数,从小到大的顺序排序,小顶堆中的元素都大于等于大顶堆中的元素,显然中位数就是大顶堆的根节点与小顶堆的根节点之和的平均数。
⭐当数目为偶数的时候,将这个值插入大顶堆中,再将大顶堆中根节点(即最大值)插入到小顶堆中;
⭐当数目为奇数的时候,将这个值插入小顶堆中,再讲小顶堆中根节点(即最小值)插入到大顶堆中;
⭐取中位数的时候,如果当前个数为偶数,显然是取小顶堆和大顶堆根结点的平均值;如果当前个数为奇数,显然是取小顶堆的根节点
链接:https://www.nowcoder.com/questionTerminal/9be0172896bd43948f8a32fb954e1be1?f=discussion
import java.util.PriorityQueue;
import java.util.Comparator;
public class Solution {
//小顶堆
private PriorityQueue<Integer> minHeap = new PriorityQueue<Integer>();
//大顶堆
private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(15, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2 - o1; //compareTo方法是字符串的?
}
});
int count = 0;//记录偶数个还是奇数个
public void Insert(Integer num) {
//个数为偶数的话,则先插入到大顶堆,然后将大顶堆中最大的数插入小顶堆中
if((count&1)==0){
maxHeap.offer(num);
int temp1=maxHeap.poll();
minHeap.offer(temp1);
count++;
}else{
//个数为奇数的话,则先插入到小顶堆,然后将小顶堆中最小的数插入大顶堆中
minHeap.offer(num);
int temp1=minHeap.poll();
maxHeap.offer(temp1);
count++;
}
}
public Double GetMedian() {
//当前为偶数个,则取小顶堆和大顶堆的堆顶元素求平均
if(count % 2 == 0){
return (double)(minHeap.peek() + maxHeap.peek())/2;
}else{
//当前为奇数个,则直接从小顶堆中取元素即可
return (double)(minHeap.peek());
}
}
}
通过这个题突然发现,java中最大堆的实现并不难,所以海量数据处理的TOP K问题用堆也并不难写哎~