1 题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例 1:
输入:
[“MedianFinder”,“addNum”,“addNum”,“findMedian”,“addNum”,“findMedian”]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
示例 2:
输入:
[“MedianFinder”,“addNum”,“findMedian”,“addNum”,“findMedian”]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
限制:
最多会对 addNum、findMedia进行 50000 次调用。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/shu-ju-liu-zhong-de-zhong-wei-shu-lcof
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
2 解题思路
-方法一 大顶堆
由于我们只需得到数据流的中位数,其实并不需要保证整个序列有序。类比一下快速排序的原理,我们将序列分为长度相等或相差1的两个序列,其一部分的全部数大于另一部分的全部数,则当知道大序列的最小值和小序列的最大值我们就可以得到中位数了。所以我们可以分别维护一个大根堆和一个小根堆。
- Java解法思路:用大小堆
如果数组长度为奇数,中位数是最中间的那个,如果长度为偶数是中间偏左的那个元素
使用最大堆来存储等于或小于中位数的值,只需poll一次就可弹出当前的中位数,使用最小堆来存储大于中位数的值。
此外需要保持两个堆平衡,因为我们要获得中位数,所以最大堆的大小将始终等于或比最小堆的大小大1,保持平衡就好 - python解法思路:用大小堆
我们将中位数左边的数保存在大顶堆中,右边的数保存在小顶堆中。这样我们可以在 O(1) 时间内得到中位数。
注意:Python 中没有大顶堆,只能将值取负保存在小顶堆来模拟。为了方便理解,将堆用优先队列表示
-
复杂度分析
时间复杂度:O(logn)。堆插入和删除需要 O(logn),查找中位数需要 O(1)。
空间复杂度:O(n)。 -
方法二:排序法
还想小声bb个有关于排序的解题方法,思路很清晰,但是代码质量不高,还有很大的优化空间
此方法是最简单直接的一个方法,我们将添加的数保存在数组中,返回中位数时,只需将数组排序,返回中间位置数即可。
3 解决代码
- 方法一 大顶堆Java代码
class MedianFinder {
private PriorityQueue<Integer> maxHeap,minHeap;
/** initialize your data structure here. */
public MedianFinder() {
//构建大顶堆和小顶堆
maxHeap = new PriorityQueue<>(Collections.reverseOrder());
minHeap = new PriorityQueue<>();
}
public void addNum(int num) {
maxHeap.offer(num);
minHeap.offer(maxHeap.poll());
如果不平衡则调整
if(minHeap.size() > maxHeap.size()){
maxHeap.offer(minHeap.poll());
}
}
public double findMedian() {
if(maxHeap.size() == minHeap.size()){
return (maxHeap.peek() + minHeap.peek())*0.5 ;
}
return maxHeap.peek();
}
}
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder obj = new MedianFinder();
* obj.addNum(num);
* double param_2 = obj.findMedian();
*/
- 方法一 大顶堆python代码
class MedianFinder:
def __init__(self):
"""
initialize your data structure here.
"""
self.max_heap = []
self.min_heap = []
def addNum(self, num: int) -> None:
if len(self.max_heap) == len(self.min_heap):
tmp = heapq.heappushpop(self.max_heap, -num)
heapq.heappush(self.min_heap,-tmp)
else:
tmp = heapq.heappushpop(self.min_heap,num)
heapq.heappush(self.max_heap, -tmp)
def findMedian(self) -> float:
if len(self.max_heap) == len(self.min_heap):
return (-self.max_heap[0] + self.min_heap[0])/2
else:
return self.min_heap[0]
# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()
-
- 方法二:排序法Java 代码
class MedianFinder:
def __init__(self):
"""
initialize your data structure here.
"""
self.store = []
def addNum(self, num: int) -> None:
#将添加的数保存在数组中
self.store.append(num)
def findMedian(self) -> float:
self.store.sort()
n = len(self.store)
# n 是奇数,返回中间的那个数,n是偶数,返回中间两数的平均值
if n & 1 == 1:
return self.store[n // 2]
else:
return (self.store[n // 2 - 1] + self.store[n // 2]) / 2