数据流中的中位数

本文探讨如何在数据流中实时计算中位数,提出了使用大顶堆+小顶堆以及直接链表插入的思路,保证了在插入新数据和获取中位数时都能保持高效的时间复杂度。当数据数量为奇数时,中位数为小顶堆堆头;偶数时,中位数为两堆堆头的平均值。此外,还提及了利用TreeSet的解决方案。
摘要由CSDN通过智能技术生成

题目描述:如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

思路一:

Java的PriorityQueue默认内部是自然排序,结果为小顶堆,也可以自定义排序器,比如下面反转比较,完成大顶堆。   

为了保证插入新数据和取中位数的时间效率都高效,使用大顶堆+小顶堆的容器,并且满足: 

1、两个堆中的数据数目差不能超过1,这样可以使中位数只会出现在两个堆的交接处; 

2、大顶堆的所有数据都小于小顶堆,这样就满足了排序要求;

3、当insert的数字个数为奇数时:使小顶堆个数比大顶堆多1;               

4、当insert的数字个数为偶数时,使大顶堆个数跟小顶堆个数一样;         

5、那么当总数字个数为奇数时,中位数就是小顶堆堆头;                   

6、当总数字个数为偶数时,中位数就是 2个堆堆头平均数。

*当数据总数为偶数时,新加入的元素,进入小顶堆(经过大顶堆筛选,取出大顶堆中最大的元素进入小顶堆)

*当数据总数为奇数时,新加入的元素,进入大顶堆(经过小顶堆筛选,取出小顶堆中最小的元素进入大顶堆)

import java.util.Comparator;
import java.util.PriorityQueue;

pub
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值