【两次过】数据流中的中位数

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。


解题思路:

如果直接采用数组存储,然后排序获得中位数,时间复杂度为O(n)。最理想的状况是采用红黑树或者AVL树,但是库中没有实现这两者数据结构,所以本题采用大小堆的方式,时间复杂度为O(logn)。

设中位数由P1,P2指向,若容器数目是偶数,则中位数是p1, p2的平均数,若容器数目是奇数,则p1, p2指向同一个数。

注意到p1指向的是容器左边部分的最大值,p2指向的是容器右边部分的最小值,所以我们可以使用最大堆保存一半的数,堆顶即为p1,最小堆保存另一半的数,堆顶即为p2,要保证最大最小堆容量差不超过1,为了实现平均分配,可以在数据的总数目是偶数时把新数据插入最小堆,否则插入最大堆。

还要保证最大堆的所有数据都要小于最小堆中的数据。当需要将一个数据插入最大堆时,可以先将其插入到最小堆,然后poll出最小堆的数再插入最大堆,这样就保证了最大堆的数据都小于最小堆,同理亦然。

import java.util.*;
public class Solution {
    private int count = 0;
    private PriorityQueue<Integer> minHeap = new PriorityQueue<>();
    private PriorityQueue<Integer> maxHeap = new PriorityQueue<>
        (11, Comparator.reverseOrder());
    
    public void Insert(Integer num) {
        
        if (count %2 == 0) {//当数据总数为偶数时,新加入的元素,应当进入小根堆
            //(注意不是直接进入小根堆,而是经大根堆筛选后取大根堆中最大元素进入小根堆)
            //1.新加入的元素先入到大根堆,由大根堆筛选出堆中最大的元素
            maxHeap.offer(num);
            int filteredMaxNum = maxHeap.poll();
            //2.筛选后的【大根堆中的最大元素】进入小根堆
            minHeap.offer(filteredMaxNum);
        } else {//当数据总数为奇数时,新加入的元素,应当进入大根堆
            //(注意不是直接进入大根堆,而是经小根堆筛选后取小根堆中最大元素进入大根堆)
            //1.新加入的元素先入到小根堆,由小根堆筛选出堆中最小的元素
            minHeap.offer(num);
            int filteredMinNum = minHeap.poll();
            //2.筛选后的【小根堆中的最小元素】进入大根堆
            maxHeap.offer(filteredMinNum);
        }
        count++;
    }

    public Double GetMedian() {
    if (count %2 == 0) 
        return new Double((minHeap.peek() + maxHeap.peek())) / 2;
    else
        return new Double(minHeap.peek());
    }
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值