如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

问题:如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

分析:

数据时从一个数据流中读出来的,数据的数目随着时间的变化而增加。如果用一个数据容器来保存从流中读出来的数据,当有新的数据从流中读出来时,这些数据就插入到数据容器中。用什么样的数据结构比较合适呢?我们可以先分析下:

一是没有排序的数组。很容易想到的是用Partition函数找到数组中的中位数。这样一来的话,插入一个数字和找出中位数的时间复杂度是O(1)和O(n)。

二是排序的数组。但是插入操作的时间复杂度是O(n),由于是排好序的数组,所以找到中位数是一个简单的操作,只需要时间复杂度为O(1)。

三是排序的链表。需要O(n)时间才能在链表中找到合适的位置插入新的数据。之前我们讨论过采用两个指针指向链表中间结点,那么可以在O(1)时间找到中位数。这样一来,时间效率与基于排序的数组的时间效率是一样的。

四是二叉搜索树。可以将把插入新数据的平均时间降到O(nlogn),但是问题是当二叉搜索树极度不平衡的时候看起来像一个排序的链表,插入新数据的时间将是O(n)。为了得到中位数,可以在二叉树结点中添加一个表示子树结点数目的字段。凭借这个字段,可以在平均时间O(nlogn)时间得到中位数,但最坏的情况仍然需要O(n)时间。

五是利用平衡的二叉树,即AVL树。AVL树的平衡因子定义是左右子树的高度差,为找到中位数,我们可以把AVL树的平衡因子定义为左右子树结点数目之差。这样一来可以在O(nlogn)时间内往AVL树添加一个新结点,同时用O(1)时间得到我们需要的中位数。可以说AVL树的效率是最高的,但在短时间内编写其代码不是件容易的事。

六是最大堆和最小堆结合。如果数据在容器中已经排序,那么中位数可以由P1和P2指向的数得到,如果容器中数据的数目是奇数,那么P1和P2指向同一个数据。如下图所示:

如图整个数据容器分隔成两个部分,位于容器左边部分的数据比右边的数据小,P1指向的数据是左边部分最大的数,P2指向的数据是右边部分最小的数。如果我们能够保证数据容器左边的数据都小于右边的数据,这样即使左右两边内部的数据没有排序,也可以根据左边最大数和右边最小数得到中位数。所以自然想到的是用一个最大堆实现左边的数据容器,用最小堆实现右边的数据容器。这样一来,可以在O(nlogn)时间内添加一个新结点,同时用O(1)时间得到我们需要的中位数。在分析上我们必须起码满足两个基本保证:一是保证数据平均分配到两个堆中,因此两个堆中数据的数目之差不能超过1,所以在数据总数目是偶数时把新数据插入到最小堆中或最大堆中;二是保证最大堆里的所有数据都小于最小堆中所有的数据。编写代码时,要仔细考虑。

不同数据结构的比较如下:


综上,采用最大堆和最小堆相结合的方案是性价比最高。

import java.util.*;


public class Solution{
int count;
PriorityQueue minHeap = new PriorityQueue();
@SuppressWarnings("unchecked")
PriorityQueue maxHeap = new PriorityQueue(11, new Comparator() {


@Override
public int compare(Object o1, Object o2) {
// TODO Auto-generated method stub
// PriorityQueue默认是小顶堆,实现大顶堆,需要反转默认排序器
return ((Integer) o2).compareTo((Integer) o1);
}
});


public void Insert(Integer num) {
count++;
if ((count & (0x1)) == 0) { // 判断偶数的高效写法


if (!maxHeap.isEmpty() && num < (Integer) maxHeap.peek()) {
maxHeap.offer(num);
num = (Integer) maxHeap.poll();


}


minHeap.offer(num);


} else {
if (!minHeap.isEmpty() && num > (Integer) minHeap.peek()) {
minHeap.offer(num);
num = (Integer) minHeap.poll();


}


maxHeap.offer(num);


}


}


public Double GetMedian() {
if (count == 0) {
throw new RuntimeException("no available number!");
}
// 总数为奇数时,大顶堆堆顶就是中位数
double result;
if ((count & (0x1)) == 1) {
result = Double.parseDouble(maxHeap.peek() + "");
}


else {
result = (Double.parseDouble(minHeap.peek() + "") + Double
.parseDouble(maxHeap.peek() + "")) / 2.0;
}


return result;


}
}


  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值