数据流中的中位数

1.本题知识点
   树,大顶堆,小顶堆
2. 题目描述
   如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
3. 思路
   此题有点小绕,我们分析一下:
   ① 先弄清楚概念:中位数、大顶堆、小顶堆。
   ② 如果想得到中位数,我们只需满足2个条件:
      条件1:将数据均分配到左右2个容器中;
      条件2:保证左容器所有数都小于或大于右容器的数即可。
   ③ 根据②的分析举例说明,比如,如果数据流中个数是奇数,分配到左容器(大顶堆),偶数分配到右容器(小顶堆中),满足了条件1;在分配时要跟堆顶元素比较,以满足条件2。
   ④ 最后,如何获取中位数:如果是奇数,中位数就是大顶堆堆顶元素,如果是偶数,中位数就是2个堆顶元素之和除以 2.
   Java 版:
import java.util.Comparator;
import java.util.PriorityQueue;

//此题的关键是对大小顶堆的认识 以及 java中实现大小顶堆的容器PriorityQueue的使用
public class Solution {
    private int count ;//读取数值是记录数量(奇偶)
    //默认最小堆容器
    private PriorityQueue<Integer> minHeap = new PriorityQueue<>();
    //最大堆容器
    private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(11,new Comparator<Integer>(){
        //@Override
        public int compare(Integer o1,Integer o2){
            return o2.compareTo(o1);
        }
    });

    public void Insert(Integer num) {
        count++;
        //如果是偶数,放入小顶堆,但是放入之前要先跟堆顶元素比较
        if((count & 1) == 0){
            //如果当前元素小于大顶堆堆顶元素,需要将大顶堆元素移入小顶堆
            if(!maxHeap.isEmpty() && num < maxHeap.peek()){
                maxHeap.offer(num);//当前元素插入大顶堆
                num = maxHeap.poll();//弹出大顶堆堆顶元素
            }
            minHeap.offer(num);//大顶堆堆顶元素移入小顶堆
        }
        else{//如果是奇数,放入大顶堆
            //如果当前元素大于小顶堆堆顶元素,需要将大顶堆元素移入小顶堆
            if(!maxHeap.isEmpty() && num > minHeap.peek()){
                minHeap.offer(num);//当前元素插入小顶堆
                num = minHeap.poll();//弹出小顶堆堆顶元素
            }
            maxHeap.offer(num);//小顶堆堆顶元素移入大顶堆
        }
    }

    public Double GetMedian() {
        if(count == 0) throw new RuntimeException("no available number!");
        //偶数时,中位数为俩堆顶元素的平均值
        if((count & 1) == 0){
            return (minHeap.peek() + maxHeap.peek())/2.0;
        }
        else{
            return maxHeap.peek() * 1.0;
        }
    }
}
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
计算数据流中位数可以通过Flink的ProcessFunction来实现。 具体实现步骤如下: 1. 将数据流按照大小排序 2. 计算数据流的长度,如果是奇数,则中位数为第 (length+1)/2 个元素;如果是偶数,则中位数为第length/2个元素和第(length/2+1)个元素的平均值。 3. 在ProcessFunction的实现,可以使用状态变量来保存数据流的有序列表,并计算中位数。 以下是一个简单的示例代码: ```java public class MedianFunction extends ProcessFunction<Integer, Double> { private ListState<Integer> values; @Override public void open(Configuration parameters) throws Exception { super.open(parameters); values = getRuntimeContext().getListState(new ListStateDescriptor<Integer>("values", Integer.class)); } @Override public void processElement(Integer value, Context ctx, Collector<Double> out) throws Exception { values.add(value); List<Integer> sortedValues = new ArrayList<>(); for (Integer v : values.get()) { sortedValues.add(v); } Collections.sort(sortedValues); int length = sortedValues.size(); if (length % 2 == 0) { double median = (sortedValues.get(length/2) + sortedValues.get(length/2 - 1)) / 2.0; out.collect(median); } else { double median = sortedValues.get(length/2); out.collect(median); } } } ``` 在上述代码,我们使用了ListState来保存数据流的元素,并在每次处理新元素时重新排序并计算中位数。注意,这只是一个简单的示例,实际应用需要考虑更多的问题,比如数据倾斜、数据丢失等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值