题目:
如何得到一个数据流中的中位数?
如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。
如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
-----------------
示例:
输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
限制:
最多会对 addNum、findMedian 进行 50000 次调用。
-------------------
思考:
给定一长度为 N 的无序数组,其中位数的计算方法:
首先对数组执行排序(使用 O(NlogN) 时间),然后返回中间元素即可(使用 O(1)时间)。
针对本题,根据以上思路,可以将数据流保存在一个列表中,并在添加元素时 保持数组有序 。
此方法的时间复杂度为 O(N) ,
其中包括: 查找元素插入位置 O(logN) (二分查找)、向数组某位置插入元素 O(N)
(插入位置之后的元素都需要向后移动一位)。
借助 堆 可进一步优化时间复杂度。
建立一个 小顶堆 A 和 大顶堆 B ,各保存列表的一半元素,且规定:
-------------
随后,中位数可仅根据 A, B 的堆顶元素计算得到。
算法流程:
设元素总数为 N = m + n ,其中 m 和 n 分别为 A 和 B 中的元素个数。
addNum(num) 函数:
1、当 m = n(即 N 为 偶数):需向 A 添加一个元素。
实现方法:将新元素 num 插入至 B ,再将 B 堆顶元素插入至 A ;
2、当m≠n(即 N 为 奇数):需向 B 添加一个元素。
实现方法:将新元素 num插入至 A ,再将 A 堆顶元素插入至 B ;
假设插入数字 num遇到情况 1. 。由于 num 可能属于 “较小的一半” (即属于 B ),
因此不能将 nums 直接插入至 A 。而应先将 num 插入至 B ,再将 B 堆顶元素插入至 A 。
这样就可以始终保持 A 保存较大一半、 B 保存较小一半。
findMedian() 函数:
1、当 m = n( N 为 偶数):则中位数为 (( A 的堆顶元素 + B 的堆顶元素 )/2)/2。
2、当m≠n( N 为 奇数):则中位数为 A的堆顶元素。
-----------------------
复杂度分析:
时间复杂度:
查找中位数 O(1) : 获取堆顶元素使用 O(1)时间;
添加数字 O(logN) : 堆的插入和弹出操作使用 O(logN) 时间。
空间复杂度 O(N) : 其中 N 为数据流中的元素数量,小顶堆 A 和大顶堆 B 最多同时保存 N 个元素。
------------
Java 使用 PriorityQueue<>((x, y) -> (y - x)) 可方便实现大顶堆。
-------------------
class MedianFinder {
Queue<Integer> A,B;//创建全局变量:两个队列
/** initialize your data structure here. */
public MedianFinder() {
A = new PriorityQueue<>();//小顶堆, 保存较大的一半
B = new PriorityQueue<>((x, y) -> (y - x));//大顶堆,保存较小的一半
}
public void addNum(int num) {
if (A.size() != B.size()) {//数据流为奇数个:找到当前除B堆外的最小元素添加到B顶堆
A.add(num);//将新元素 num插入至 A ,再将 A 堆顶元素插入至 B
B.add(A.poll());
}else {//数据流为偶数个:找到当前除A堆外的最大元素添加到A顶堆
B.add(num);//将新元素 num 插入至 B ,再将 B 堆顶元素插入至 A ;
A.add(B.poll());
}
}
public double findMedian() {
return A.size() != B.size() ? A.peek() : (A.peek() + B.peek()) / 2.0;
}//若总元素为奇数,则返回A顶堆堆顶的元素| 若总元素为偶数,则返回A,B顶堆堆顶的元素和/2
}
/**
A:小顶堆:保存较大的一半, 堆顶元素为最小元素
B: 大顶堆:保存较小的一半, 堆顶元素为最大元素
*/