题目描述:
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例 1:
输入:
[“MedianFinder”,“addNum”,“addNum”,“findMedian”,“addNum”,“findMedian”]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]
示例 2:
输入:
[“MedianFinder”,“addNum”,“findMedian”,“addNum”,“findMedian”]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]
思路1:
维护一个数组,每次以快排的方式,重新进行排序,然后按照中位数的计算方式返回值即可。
时间复杂度即为O(NlogN)。
class MedianFinder:
def __init__(self):
"""
initialize your data structure here.
"""
self.nums = []
self.length = 0
def addNum(self, num: int) -> None:
self.nums.append(num)
self.length += 1
def findMedian(self) -> float:
if self.length == 0:
return 0
self.nums.sort()
if self.length % 2 == 1:
return self.nums[self.length//2]
else:
return (self.nums[self.length//2] + self.nums[self.length//2 - 1])/2
# Your MedianFinder object will be instantiated and called as such:
# obj = MedianFinder()
# obj.addNum(num)
# param_2 = obj.findMedian()
思路2:
来源于优秀题解
使用两个堆来完成,A堆存储数组中数较大的一半,B堆存储数组中值较小的一半。
A用一个小顶堆实现,这样堆顶的元素就是较大数中,最小的一个;
B用一个大顶堆实现,这样堆顶的圆度就是较小数中,最大的一个;
特殊地,当总数N是偶数时,A和B各村N/2个数;当总数N是奇数时,A存N//2+1个,B存N//2个。
在加入一个新的数的时候,
如果此时A和B的数量相同,先把数加入到B中,然后把B的顶给A;
如果此时A和B的数量不相同,先把数加入到A中,然后把A的顶给B。
需要注意的是,在python中heapq 模块是小顶堆。实现 大顶堆 方法: 小顶堆的插入和弹出操作均将元素 取反 即可。
from heapq import *
class MedianFinder:
def __init__(self):
self.A = [] # 小顶堆,保存较大的一半
self.B = [] # 大顶堆,保存较小的一半
def addNum(self, num: int) -> None:
if len(self.A) != len(self.B):
heappush(self.B, -heappushpop(self.A, num))
else:
heappush(self.A, -heappushpop(self.B, -num))
def findMedian(self) -> float:
return self.A[0] if len(self.A) != len(self.B) else (self.A[0] - self.B[0]) / 2.0